音声から文字に

| 小ネタ! |

最近youtubeなどの動画配信サイトで音声を自動的に文字起こしする機能があるのはご存じでしょうか。
この機能にはコンピュータに音声を認識させる技術が必須となりますが、音声認識の業界は近年飛躍的な進歩を遂げているそうです。

この技術では音声の波形データを元に利用者が話す内容を推測します。
そのため、会議内容や音声メモの文字起こし、動画の字幕自動生成などに利用されています。
機械を手に取らずとも声をかけるだけで操作できるSiriやAlexaなどもこの技術を利用しており、実際利用されている方は多いかもしれません。

株式会社フュートレックはそんな音声認識技術を主力事業とした企業です。
この会社にかかると、ノイズの多い環境での音声認識や、声の特徴に基づいた話者の特定、音声翻訳までできてしまうそうです。
さらに、テキスト情報を読み込ませてカスタマイズすることで、文章化が難しい業界特有の表現なども可能となるとか。

特に文字起こしなどは聴覚に障碍がある方などにも大変需要があるのではないでしょうか。
中国語やアラビア語が読めるといいな、と思う機会がたまにあるので、個人的に音声翻訳はぜひ試してみたい機能です。

アーカイブ

Kmonos(クモノス)ブログについて

2024年5月
 12345
6789101112
13141516171819
20212223242526
2728293031