すごい良い

個人的に音声認識ってリアルタイム以外にも動画ファイルから字幕起こしとかの場面とかあると思うのですが、動画などで声にBGMが乗ってると認識精度が落ちる問題あるじゃないですか。ああいうのをはじくために前段でBGMと声分離する必要があって、それがここまで綺麗に分離できるってすごい。 いろんな用途がありそう。比較動画もすごい良い。勉強になります。

おやすみなさい。