この記事の3行まとめ
Algomaticは2024年12月11日(水)、AIを活用した音声生成プラットフォーム『にじボイス』において、アプリケーションやサービスへの組み込みを想定したAPIの正式公開を発表しました。
『にじボイス』は、2024年12月4日(水)に正式リリースされた、生成AIを活用した音声生成プラットフォームです。老若男女さまざまな、計100体のキャラクターとボイスが用意されています。
キャラクターを選択してテキストを入力するだけで、感情豊かな音声を生成可能。生成した音声はMP3形式でダウンロードできます。なお、音声の生成には会員登録が必要(※)なほか、文字数により有料サブスクリプションへの加入も必要になります。
※ サンプルボイスの試聴であればログイン不要
今回提供されたAPIは、アプリケーションやサービスへの組み込みなどを想定しています。入力テキストに応じて自動的に感情表現を変化させる「TTS(Text-to-Speech)」機能を中心に拡張されており、感情のパラメータ設定などをせずに「空気を読んだ」音声が高速で生成できるとのこと。
本APIの料金支払いはプリペイド方式で、価格は10,000文字あたり825円(税込)です。初回特典として、新規アカウントには5,000文字が無料で付与されます。
本APIの提供により、リアルタイム配信との連携が可能になります。コンテンツやコメントなど、ライブ情報に合わせた音声を生成できるとのこと。
また、研修コンテンツ・マニュアルの音声生成や字幕の自動音声化など、音声を含む大規模なコンテンツ制作の生産性が向上することなども述べられています。
詳細は、公式サイトやドキュメント、プレスリリースをご確認ください。
『にじボイスAPI』ドキュメント『にじボイス』公式サイトプレスリリース
以下、プレスリリースからの引用です。
株式会Algomatic(本社:東京都港区、代表取締役:大野 峻典、以下 Algomatic)は、2024年12月11日、AIを活用した音声生成プラットフォーム『にじボイス』( https://nijivoice.com/ )において、動画コンテンツ事業者向けに『にじボイスAPI』を正式公開したことをお知らせいたします。これにより、AITuberなどのリアルタイム配信システムとの生成音声の統合や大規模コンテンツ生成の効率化を実現し、生成音声を活用したこれまでにない新たな事業領域の開拓を促進してまいります。
『にじボイス』は、AIを活用した感情豊かな音声を生成するプラットフォームです。キャラクターを選択しテキストを入力することで、誰でも簡単に感情豊かな音声を生成することができます。2024年11月に、クローズドβ版をリリースし、その後『にじボイス』β版として提供。同年12月には、『にじボイス』正式リリースとともに、ボイスパートナーへの収益還元を開始し、生成対象の文字数に140字の制限がありながらも、約1カ月間での累積生成文字数は約3,000万文字規模に到達しています。
この度、これまで200社以上の企業のみなさまからいただいてきた要望にお応えし、『にじボイスAPI』を正式公開する運びとなりました。入力テキストに応じて自動的に感情表現を変化させる革新的なTTS(Text-to-Speech)機能を中心にAPIとして拡張。感情パラメーターを逐一設定する必要がないため、大規模コンテンツの制作においても、“空気を読んだ”音声生成を実現することが可能となり、ライブ配信や動画自動生成といった事前チェックが難しい場面においても、ユーザーに最適化した音声コンテンツをスピーディーに提供することができます。既存システムと連携したリアルタイムでの音声生成や、モバイルアプリやIoTデバイスなどのアプリケーションへの組み込みによる動的な音声生成に加えて、下記のような活用を促進します。
■『にじボイスAPI』によって可能になること
- リアルタイム配信システムとの統合
配信プラットフォームと連携し、コメントやコンテンツなどでのライブ情報に合わせて音声を生成し、より優れたコンテンツを提供します。 - 大規模コンテンツの効率化
複数トラックへの一括での音声生成、字幕の自動音声化、研修コンテンツやマニュアルの音声生成など、音声を含む大規模なコンテンツ制作での生産性向上を実現します。 - 多彩なキャラクターによる高度な音声体験
キャラクター情報取得APIを活用し、計100体の老若男女さまざまなキャラクター情報を参照可能。ユーザーの応答や利用状況に合わせて適切なキャラクターを選択し、より深い没入感のある音声体験を実現します。
『にじボイス』では、引き続き声の持ち主の権利と意志を守りながら、生成音声の表現とその可能性の拡張に取り組んでまいります。
【にじボイス 事業責任者 コメント】
原田 祐二(株式会社Algomatic 執行役員 Algomatic Global カンパニーCEO)
『にじボイス』は、さまざまな企業の皆さまが新たな価値を創造し、それぞれのビジネスをさらに進化させるお手伝いをするために生まれました。
なかでも特に、AITuberやリアルタイムAI、動画生成AIなどの革新的な技術と組み合わせることで、これまでにないスピードで新たなビジネスの可能性が広がっていくと確信しています。
このAPIが、皆さまのアイデアを形にする一助となり、未来を共に切り拓いていく存在となっていければと願っています。
『にじボイス』は、さまざまな企業の皆さまが新たな価値を創造し、それぞれのビジネスをさらに進化させるお手伝いをするために生まれました。
なかでも特に、AITuberやリアルタイムAI、動画生成AIなどの革新的な技術と組み合わせることで、これまでにないスピードで新たなビジネスの可能性が広がっていくと確信しています。
このAPIが、皆さまのアイデアを形にする一助となり、未来を共に切り拓いていく存在となっていければと願っています。
・note:https://note.com/1230yuji/
【Algomaticについて】
社 名 :株式会社Algomatic
所在地 :東京都港区六本木三丁目2番1号
代表者 :大野 峻典
設 立 :2023年4月13日
事業内容: 大規模言語モデル等生成AI技術を活用した、サービスの開発・提供
URL:https://algomatic.jp/