音声圧縮コーデック「Opus」バージョン1.5がリリース。信号の処理・生成に機械学習が導入され、パケットロスが起こっても音声が途切れにくくなる

2024.03.08
ニュースサウンド
この記事をシェア!
Twitter Facebook LINE B!
Twitter Facebook LINE B!

この記事の3行まとめ

  • 音声圧縮コーデック「Opus」のバージョン1.5がリリース
  • 信号の処理や生成に機械学習を導入し、パケットロスによる音声途切れへの耐性が向上
  • 公式サイトでは、以前のバージョンと聞き比べられるサンプルが公開されている

2024年3月4日(現地時間)、音声圧縮コーデック「Opus」がバージョン1.5に大型アップデートされました。

(画像は公式サイトより引用)

Opusは、The Internet Engineering Task Force(IETF)によって開発され、BSD-3 Clauseライセンスの下で提供される、オープンフォーマットの音声圧縮コーデックです。

低ビットレートでも音質の劣化が少なく、低レイテンシで圧縮できるため、ボイスチャットやストリーミングなど双方向性が必要なリアルタイム通信などに適しています。

Opusは以前より音声か音楽かどうかの検出などに機械学習を使用していましたが、信号そのものの処理や生成に機械学習を用いたのは今回が初めて。これにより、音声通話などで起こり得るパケットロスに対する耐性が向上したほか、ネットワーク状況の悪い環境などで使用される低ビットレートでの音質が向上しています。

ほとんどのコーデックには、パケットロスに対応する「PLC(Packet Loss Concealment)」が搭載されており、パケットロスが起こっても前後の音声情報から途切れた部分を補完するなどで不自然な音声になることを防いでいます。

しかし、大きなロスでは単語ごと失われてしまう可能性もあるため、予備的な重複データを用いて冗長性(Redundancy)を持たせています。今回、Opusはこれらに併せてディープラーニングを用いて効率的に冗長性を持たせる技術「DRED(Deep REDundancy)」を導入したことで、より大きなパケットロスにも対処できるようになりました。

パケットロスへの対処技術の有無で音質を比較したグラフ。DREDを使用することで、音質評価がより大きく向上するのがわかる(画像は公式サイトより引用)

公式サイトでは、DREDの有無によって聞こえ方を比較できるサンプル音声が試聴できます。

低ビットレートでの音質向上に関する技術的な解説やそのほかのアップデート内容などの詳細は、公式サイトをご確認ください。

Opus 1.5 ReleasedOpus 公式サイト

関連記事

ゲームのボイス制作全般を担う新たな分野「ボイスデザイン」とは。Audiokineticのブログで解説記事が公開
2024.07.11
18,939曲のフリーBGMが掲載。フリーBGM協会、協賛作曲家のBGMを検索・視聴できる「フリーBGMデータベース」を発表
2024.06.26
Epic Games、UEとUEFNにおけるオーディオ技術の紹介記事を公開。メタバースのサウンド構築に使える「MetaSounds」、音楽制作ツールセット「Patchwork」なども解説
2024.06.18
ゲームの振動は誰が、どのように作るべきか?――『FORSPOKEN』開発者やサウンドディレクターら4名が“現代の触覚デザイン”を徹底討論【SIG-AUDIO 2024 Vol.03レポート】
2024.06.06
荷ほどきゲーム『Unpacking(アンパッキング)』に収録された効果音は14,000種以上。膨大なサウンドデータを効率よく命名・整理した方法を、Audiokineticが公開
2024.05.22
iZotope、高機能オーディオリペアツール「RX 11」を発売。機械学習による超強力なノイズ除去ツールの進化など、注目の新機能を紹介
2024.05.17

注目記事ランキング

2024.07.20 - 2024.07.27
VIEW MORE

連載・特集ピックアップ

イベントカレンダー

VIEW MORE

今日の用語

フォグ(Fog)
フォグ 「霧」を意味する英単語。3DCGにおいて、現実の霧による見た目をシミュレーションする画面効果やエフェクトを指す。代表的なものとして、カメラから遠くにあるオブジェクトの色調を変化させることで遠近感を出す手法がある。
VIEW MORE

Twitterで最新情報を
チェック!