NABLAS株式会社が多言語音声を活用した日本語TTSモデルを開発

NABLAS株式会社が多言語音声を活用した日本語TTSモデルを開発

NABLASが開発した多言語対応日本語TTSモデルの発表

NABLAS株式会社は、声質を保持したまま日本語のテキストを音声合成する新しいTTS(テキスト・トゥ・スピーチ)モデルを開発しました。このモデルは多言語話者の発話音声データを使用し、流暢な日本語の音声合成を実現。これにより、通訳や発話障害者への支援、映画や動画の多言語化など、さまざまな分野での活用が期待されています。音声データの試聴も可能で、技術の進展が広範な用途を広げることが示されています。

この記事の要約

  • NABLAS株式会社が新しい日本語TTSモデルを開発。
  • 多言語話者の声質を活かした流暢な日本語合成が可能。
  • 幅広い分野への応用が期待され、試聴も可能。

AI総合研究所として活動するNABLAS株式会社 (本社 : 東京都文京区本郷、 代表取締役 所長 : 中山 浩太郎、 以下「当社」)は、多言語話者の声質を保持したまま、日本語テキスト音声合成を可能とするTTS ( Text-to-Speech ) モデルを開発しました。本モデルは、言語を問わない数秒の発話音声のデータを用いて、他言語話者の音声から流暢な日本語の音声合成が可能です。本技術により通訳や発話困難者への支援、映画や動画などのエンターテインメント作品の多言語化など、幅広い分野での応用が期待できます。

▼音声データはこちらで試聴いただけます。

https://www.nablas.com/post/voice-synthesis-202410

◾️開発の背景と概要

近年、様々な音声合成の活用が急速に広がり、自動音声案内や本の読み上げ、動画の吹き替えなど音声合成を活用した場面が増えてきました。しかし、これまでの音声合成では、声優やアナウンサーが事前に決められた文章を収録し、数分からなる音声データを元に声質を再現した音声モデルの構築が必要でした。また、日本語の音声合成の場合、日本語話者による音声モデルが必要となり、他言語の音声モデルでは流暢な日本語での音声合成は難しい状況でした。

これらの課題に対して、英語や中国語、韓国語など言語を問わない数秒の発話音声データから日本語テキストを読み上げ可能な音声合成モデルを構築し、日本語話者でなくても流暢な日本語による音声合成を可能としました。また、本モデルは、Google社が開発した音声生成モデル「SoundStorm」の構造をベースとして、当社開発の日本語対応音声生成モデルを活用しており、瞬時に日本語の音声合成が可能です。

SoundStormの日本語モデルに関するリリースについてはこちらをご覧ください。

https://www.nablas.com/post/japanese-voice-synthesis

◾️本モデルの活用例

・発話困難者への支援

発話に支援を必要とされる方へ、自身または任意の音声データを用い、発言したい内容をテキスト入力し音声で出力することで発話における障壁の解消へと繋がります。

・言語学習および通訳における活用

多言語学習および通訳において、話者本人の音声データを用いて瞬時に音声合成が可能です。通訳者が翻訳内容をテキスト入力することにより、話者の声質そのままに日本語での発言が可能となります。

・エンターテインメント分野における活用

日本語吹き替えにおいて、吹き替え元となる音声を用いることで同一話者による日本語吹き替えが可能です。メディアやゲーム、オーディオブックなどコンテンツ制作のコストダウンや創作活動の幅を広げることに繋がります。

◾️今後の展望

音声合成技術は様々な分野での活用が期待される技術です。この度の多言語音声データを用いた日本語対応音声合成モデルの開発だけでなく、音声変換や、さらに高速となるリアルタイムでの対話翻訳など、日本での音声合成および音声生成技術の活用がより活発化するよう、引き続き技術開発を進めてまいります。また、それら生成AI技術の悪用防止や検出技術の開発にも引き続き取り組んで参ります。

■ お問い合わせ
NABLASの音声合成に関するお問い合わせは以下フォームからお気軽にご相談ください。https://www.nablas.com/contact

◾️NABLAS株式会社について

当社は東大発のベンチャーであり、AI人材教育・育成機関、そして最先端のAI技術、特にDeep Learning技術を活用したソリューションを提供するAI総合研究所です。AI人材育成事業では、東京大学で開発したAI人材教育コンテンツと当社でアップデートしたコンテンツを学習環境iLect Systemと共に、AI人材育成サービスとして提供しています。AIコンサル・R&D事業では、AI技術の導入・研究・開発について技術面でのコンサルティング業務を展開し、クライアントの状況に応じてAI技術の導入・開発など技術面でのサービス提供を行っています。AI技術の社会実装を様々な形で実現し、より良い未来を創造するための技術やサービスを探索・創造し続ける存在として、「Discover the gradients, Towards the future」のミッションのもと次世代を支える技術やサービスの開発に取りんでいきます。

◾️会社概要

社名:NABLAS株式会社

代表者:代表取締役 所長 中山 浩太郎

本社:東京都文京区本郷6-17-9 本郷綱ビル1F

設立:2017年3月

事業内容:AI人材育成事業/コンサルティング/研究開発

URL:https://nablas.com

記事選定/ライター
NFT-TIMES 長尾英太

ブロックチェーン技術記者、長尾といいます。ブロックチェーンについては投資/投機的な観点よりも、技術として未来の社会でどのように取り込まれていくかを中心に発信したいです。最近ではNFTやメタバースなどに注目しています。 1989年11月7日千葉出身。大学卒業後IT企業に入社。2017年にブロックチェーンの技術ライターとして独立。 Twitter
ページトップへ