NTTテクノクロス、深層学習を利用した音声合成ソフト - より自然な声を実現

NTTテクノクロス、深層学習を利用した音声合成ソフト - より自然な声を実現

  • マイナビニュース
  • 更新日:2017/12/05
No image

NTTテクノクロスは12月5日、音声合成ソフト「FutureVoice Crayon」をバージョンアップし、同日から販売すると発表した。従来の音声合成技術よりも、自然な声を実現したという。

音声合成は、コンタクトセンターでの自動音声案内や、音声対話サービスやロボットによる受付案内などで利用されている。

今回の新バージョンでは、音声合成にNTTメディアインテリジェンス研究所が開発した深層学習(DNN)を活用することで、少量の音声データから声のバリエーションを簡易に増やせると同時に、従来の音声合成技術よりも自然な声を実現したという。

具体的には、イントネーションや声質の元となる既存の大量の音声データベースを利用して、DNNを活用した音声合成をすることで、今まで困難であった声の特徴を忠実に再現した自然な音声を作成できるようになったという。

また、 既存の大量の音声データベースと深層学習を活用し、話者が違う音声のデータから読み方やアクセントを補うことで、所望の話者の少量の音声データからその話者の自然な音声合成を実現した。

同社では、これにより、今まで音声合成では置き換えが困難であったナレーションやガイダンス作成・電子書籍の読み上げなどでの用途拡大が見込めるとしている。

この記事をお届けした
グノシーの最新ニュース情報を、

でも最新ニュース情報をお届けしています。

外部リンク

IT総合カテゴリの人気記事

グノシーで話題の記事を読もう!
2017年冬の決定版!"完全ワイヤレスイヤホン"の狙い目モデル5選
ドワンゴ川上会長、niconico運営責任者を“退任”
niconico、新体制で再スタート 対話重視の運営 ユーザーは“高評価”
パーティにも使える!人気のデリバリーサービス「UberEATS」とは...?
データを暗号化? 今さら聞けないVPNの基礎知識
  • このエントリーをはてなブックマークに追加