こんにちは。
今週は、特定の分野では深層学習AIによる翻訳精度が人間のプロを超えつつある、という記事を見かけました。
深層学習AIによる機械翻訳の精度は、あらかじめ学習させた大量のデータによります。収集の難度と量の関係上、小説などの芸術性の高い文章よりは実務的な書類の方が精度が上がりやすいです。データ収集能力という点で優れるGAFAやMicrosoft、政府などがリードしているAI翻訳業界ですが、分野を絞ることでこれら以上の成果を部分的にあげている企業も存在します。
上記の大型プラットフォーマーの収集データは汎用型AI翻訳には適していますが、企業や業界ごとに異なる文脈を読み取り、より自然な文章を生成するという点では課題が残ります。そこで株式会社ロゼッタは、医療や金融といった専門分野に限定したデータ集収を行いAIに学習させることで、特定分野での高精度AI翻訳を実現しています。最近ではさらに企業ごとに限定し、社内でのみ通用する表現や言い回しを学習し、精度をさらに高めるための「オーダーメイドAI翻訳」の実現を目指しています。加えて、英語と日本語、中国語と日本語のような海外大手に任せることが可能な翻訳以外の、新興国言語と日本語のAI翻訳開発にも力を入れているそうです。こういった翻訳に海外大手が本腰を入れる可能性は低く、「日本語を軸とした翻訳に特化する」という方針をとっています。