Unity上でセリフの音声合成ができる「A.I.VOICE for GAMES」でリップシンクが可能に。キャラの口がセリフに合わせて自然に動く

Unity上でセリフの音声合成ができる「A.I.VOICE for GAMES」でリップシンクが可能に。キャラの口がセリフに合わせて自然に動く

2024.04.26
ニュースAIUnityサウンド
この記事をシェア!
Twitter Facebook LINE B!
Twitter Facebook LINE B!

この記事の3行まとめ

  • ゲーム開発環境上でボイスデータを作成できる「A.I.VOICE for GAMES」がアップデート
  • Unityで簡単に発音に合わせた「口パク」を行えるアセット「uLipSync」に対応
  • 「A.I.VOICE」側で登録した読み方やイントネーション情報もインポート可能に

エーアイは、ゲーム開発環境上でボイスデータを作成できる音声合成アセット「A.I.VOICE for GAMES」のアップデートを発表しました。

本アップデートにより「uLipSync」に対応し、いわゆる「口パク」を手軽に実装できるようになります。

A.I.VOICE」は、エーアイが開発・販売している、読み上げ用音声合成ソフトです。自社開発のAI技術を用いて、「琴葉 茜・葵」や「伊織 弓鶴」などの音声ライブラリから自然で人間らしい声を再生させることが可能です。

2023年12月には日本語解析精度やエディター機能などを改善した「A.I.VOICE2」が発売されています。また、ゲーム開発環境上で簡単にボイスデータの作成や編集を行えるエディター拡張機能「A.I.VOICE for GAMES」なども展開(※)しています。

※ 記事執筆現在、Unityのみ対応

(画像は公式サイトより引用)

今回のアップデートでは、hecomi氏によって開発・配布されている、Unityでリップシンクを実装するためのアセット「uLipSync」への対応が行われました。このアセットでは音の波形からリップシンクのパラメーターを得てブレンドシェイプの調整が行えます。

A.I.VOICE for GAMESではUnity上でボイスデータを生成した際にリップシンク情報を同時に出力することが可能です。データを後から変更した際にはリップシンク情報も自動で更新されるため、生成後の編集も気軽に行えます。

音素をリアルタイムで分析(画像は「uLipSync」GitHubページより引用)

その他の更新として、A.I.VOICE側で登録した読み方やイントネーション情報をA.I.VOICE for GAMESからも読み込めるように。

また、アセンブリとして提供されていたA.I.VOICE for GAMES機能において、GUIの構成部分などをC#コードとしての提供に変更しています。これにより開発者がGUIをカスタマイズすることが可能になりました。

詳細は、こちらをご確認ください。

「A.I.VOICE」 公式サイト

関連記事

立体音響ボイスチャットがゲームデザインの可能性を広げる!CRI ADX&TeleXusをフル活用したボードゲーム風RPG『VIractal(ヴィラクタル)』におけるサウンド演出【CEDEC2025】
2025.08.21 [PR]
ゲームにDiscord機能を組み込める公式SDK「Discord Social SDK」、ボイスチャットなどの一般提供を開始。商用利用も可能
2025.08.21
「Unity 6.2」正式リリース。無償提供中の「Unity AI」や、ユーザー端末からゲームの動作状況を計測する「Developer Data Framework」など最新機能を紹介
2025.08.18
Unity 6における作業効率化TIPSを解説する公式電子書籍が無料で公開。エディタ画面の操作やデバックでの時短テクニックを111ページにわたって解説
2025.08.14
企業でもAIやLLMを活用できる“仕組み”を作る。CygamesのAI導入手順と運用アーキテクチャ【CEDEC2025】
2025.08.08
『ストリートファイター6』“人間らしいAI”と“成長の楽しみ”が対人戦ハードルを下げる。「Vライバル」ができるまで【CEDEC2025】
2025.08.05

注目記事ランキング

2025.08.15 - 2025.08.22
VIEW MORE

連載・特集ピックアップ

イベントカレンダー

VIEW MORE

今日の用語

被写界深度(DOF)
ヒシャカイシンド
  1. Depth of Field(DOF)とも呼ばれる。カメラの焦点(ピント)があっているように見える範囲のこと。
  2. 3DCGにおいて、1をシミュレーションするエフェクト。注目させたい部分に焦点を合わせ、それ以外の部分をぼかすことができる。ゲームの開発現場においては、ボケ自体のことを示すことが多い。
VIEW MORE

Xで最新情報をチェック!