AIを活用した音声生成プラットフォーム『にじボイス』、APIを正式公開。料金の支払いはプリペイド式で、10,000文字あたり825円(税込)

2024.12.11
ニュースAI
この記事をシェア!
Twitter Facebook LINE B!
Twitter Facebook LINE B!

この記事の3行まとめ

  • Algomatic、AIを活用した音声生成プラットフォーム『にじボイス』のAPIを正式公開
  • 『にじボイス』は、キャラクターを選んでテキストを入力するだけで、感情豊かな音声を生成・ダウンロードできる
  • APIにより、リアルタイム配信システムとの連携や、字幕の自動音声化の生産性向上などが可能とのこと

Algomaticは2024年12月11日(水)、AIを活用した音声生成プラットフォーム『にじボイス』において、アプリケーションやサービスへの組み込みを想定したAPIの正式公開発表しました。

にじボイスは、2024年12月4日(水)に正式リリースされた、生成AIを活用した音声生成プラットフォームです。老若男女さまざまな、計100体のキャラクターとボイスが用意されています。

キャラクターを選択してテキストを入力するだけで、感情豊かな音声を生成可能。生成した音声はMP3形式でダウンロードできます。なお、音声の生成には会員登録が必要(※)なほか、文字数により有料サブスクリプションへの加入も必要になります。

※ サンプルボイスの試聴であればログイン不要

サブスクリプションのプラン一覧。1か月に1,000文字生成できる無料プランを含む、計8種類が展開(画像は公式サイトより引用)

今回提供されたAPIは、アプリケーションやサービスへの組み込みなどを想定しています。入力テキストに応じて自動的に感情表現を変化させる「TTS(Text-to-Speech)」機能を中心に拡張されており、感情のパラメータ設定などをせずに「空気を読んだ」音声が高速で生成できるとのこと。

本APIの料金支払いはプリペイド方式で、価格は10,000文字あたり825円(税込)です。初回特典として、新規アカウントには5,000文字が無料で付与されます。

(画像は公式サイトより引用)

本APIの提供により、リアルタイム配信との連携が可能になります。コンテンツやコメントなど、ライブ情報に合わせた音声を生成できるとのこと。

また、研修コンテンツ・マニュアルの音声生成字幕の自動音声化など、音声を含む大規模なコンテンツ制作の生産性が向上することなども述べられています。

詳細は、公式サイトドキュメントプレスリリースをご確認ください。

『にじボイスAPI』ドキュメント『にじボイス』公式サイトプレスリリース

 

以下、プレスリリースからの引用です。


株式会Algomatic(本社:東京都港区、代表取締役:大野 峻典、以下 Algomatic)は、2024年12月11日、AIを活用した音声生成プラットフォーム『にじボイス』( https://nijivoice.com/ )において、動画コンテンツ事業者向けに『にじボイスAPI』を正式公開したことをお知らせいたします。これにより、AITuberなどのリアルタイム配信システムとの生成音声の統合や大規模コンテンツ生成の効率化を実現し、生成音声を活用したこれまでにない新たな事業領域の開拓を促進してまいります。

『にじボイス』は、AIを活用した感情豊かな音声を生成するプラットフォームです。キャラクターを選択しテキストを入力することで、誰でも簡単に感情豊かな音声を生成することができます。2024年11月に、クローズドβ版をリリースし、その後『にじボイス』β版として提供。同年12月には、『にじボイス』正式リリースとともに、ボイスパートナーへの収益還元を開始し、生成対象の文字数に140字の制限がありながらも、約1カ月間での累積生成文字数は約3,000万文字規模に到達しています。

この度、これまで200社以上の企業のみなさまからいただいてきた要望にお応えし、『にじボイスAPI』を正式公開する運びとなりました。入力テキストに応じて自動的に感情表現を変化させる革新的なTTS(Text-to-Speech)機能を中心にAPIとして拡張。感情パラメーターを逐一設定する必要がないため、大規模コンテンツの制作においても、“空気を読んだ”音声生成を実現することが可能となり、ライブ配信や動画自動生成といった事前チェックが難しい場面においても、ユーザーに最適化した音声コンテンツをスピーディーに提供することができます。既存システムと連携したリアルタイムでの音声生成や、モバイルアプリやIoTデバイスなどのアプリケーションへの組み込みによる動的な音声生成に加えて、下記のような活用を促進します。

■『にじボイスAPI』によって可能になること

  1. リアルタイム配信システムとの統合
    配信プラットフォームと連携し、コメントやコンテンツなどでのライブ情報に合わせて音声を生成し、より優れたコンテンツを提供します。
  2. 大規模コンテンツの効率化
    複数トラックへの一括での音声生成、字幕の自動音声化、研修コンテンツやマニュアルの音声生成など、音声を含む大規模なコンテンツ制作での生産性向上を実現します。
  3. 多彩なキャラクターによる高度な音声体験
    キャラクター情報取得APIを活用し、計100体の老若男女さまざまなキャラクター情報を参照可能。ユーザーの応答や利用状況に合わせて適切なキャラクターを選択し、より深い没入感のある音声体験を実現します。

『にじボイス』では、引き続き声の持ち主の権利と意志を守りながら、生成音声の表現とその可能性の拡張に取り組んでまいります。

【にじボイス 事業責任者 コメント】

原田 祐二(株式会社Algomatic 執行役員 Algomatic Global カンパニーCEO)

『にじボイス』は、さまざまな企業の皆さまが新たな価値を創造し、それぞれのビジネスをさらに進化させるお手伝いをするために生まれました。

なかでも特に、AITuberやリアルタイムAI、動画生成AIなどの革新的な技術と組み合わせることで、これまでにないスピードで新たなビジネスの可能性が広がっていくと確信しています。

このAPIが、皆さまのアイデアを形にする一助となり、未来を共に切り拓いていく存在となっていければと願っています。

・note:https://note.com/1230yuji/

・X:https://x.com/1230yuji

【Algomaticについて】

社 名 :株式会社Algomatic
所在地 :東京都港区六本木三丁目2番1号
代表者 :大野 峻典
設 立 :2023年4月13日
事業内容: 大規模言語モデル等生成AI技術を活用した、サービスの開発・提供
URL:https://algomatic.jp/

関連記事

Razer、内蔵ファンで加熱・冷却するゲーミングチェアや、AIによるリアルタイムのゲームコーチング機能などを発表
2025.01.09
NVIDIA、ニューラルレンダリング技術群「NVIDIA RTX Kit」を発表。AIを活用したテクスチャ圧縮機能が搭載されたほか、レイトレーシングでは従来の100倍のパフォーマンスを発揮
2025.01.08
NVIDIA、「マルチフレーム生成」を導入したAIアップスケーリング技術「DLSS 4」を発表。入力遅延の解消に役立つ「Reflex 2」も
2025.01.08
NVIDIA、GPU「GeForce RTX™ 50」シリーズを発表。「RTX 5070」「RTX 5070 Ti」「RTX 5080」「RTX 5090」の4モデル展開で、1/30から順次発売
2025.01.07
「PS5 Pro」のGPUに盛り込んだ技術を解説するYouTube動画、SIEが公開。超解像技術「PSSR」の開発過程や、未来に向けたAMDとのさらなる連携も紹介
2024.12.19
AIによるプログラミング支援ツール「GitHub Copilot」に無料プランが登場。チャットボット「GitHub Copilot Chat」はブラウザ上で無料使用が可能に
2024.12.19

注目記事ランキング

2025.01.12 - 2025.01.19
VIEW MORE

連載・特集ピックアップ

イベントカレンダー

VIEW MORE

今日の用語

エミッター(Emitter)
エミッター
  1. 英語で「放出器」「放出源」のこと。
  2. ゲーム開発においては、パーティクルを生み出す発生源のことを示すことが多い。
VIEW MORE

Xで最新情報をチェック!