NVIDIA、大規模言語モデルの性能を最大4倍高速化する「TensorRT-LLM」をオープンソースでリリース。「Stable Diffusion」用Webアプリに使える拡張機能も併せて公開

NVIDIA、大規模言語モデルの性能を最大4倍高速化する「TensorRT-LLM」をオープンソースでリリース。「Stable Diffusion」用Webアプリに使える拡張機能も併せて公開

2023.10.30
ニュースAI
この記事をシェア!
Twitter Facebook LINE B!
Twitter Facebook LINE B!

この記事の3行まとめ

  • NVIDIA、「TensorRT-LLM」をリリース
  • NVIDIAのGPUを使用し、大規模言語モデルの推論を高速化
  • 「Stable Diffusion web UI」の生成速度を向上させる拡張機能も公開

NVIDIAは、大規模言語モデル(LLM)の推論を高速化するオープンソースライブラリ「TensorRT-LLM」をApache License 2.0でリリースしました。

(画像は公式ブログより引用)

TensorRT-LLMは、NVIDIAのGPUを使用して高速化を行います。同社は、LLMのパフォーマンスが最大で4倍高速化できたとしています。

また、パフォーマンス向上のほか、Retrieval-Augmented GenerationRAG)(※)などの手法をLLMに導入するのにも有用とのこと。
※ 学習データには含まれていない情報をプロンプトとして与えることで、より正確な回答を生成させる手法

NVIDIA公式ブログでは、Metaが開発するLLM「Llama2」と、TensorRT-LLMを利用しRAGを組み込んだLlama2の性能を比較。より正確かつ高速に回答を生成できたと報告しています。

「NVIDIA ACEはどのように感情的な反応を生み出すのか」という質問に対し、TensorRT-LLMを利用した場合(右)、利用しない場合(左)よりも正確な回答を出力している(画像は公式ブログより引用)

併せて、画像生成AI「Stable Diffusion」を使うWebアプリ「Stable Diffusion web UI」のパフォーマンスを、TensorRT-LLMで向上させる拡張機能「TensorRT Extension for Stable Diffusion Web UI」もMITライセンスでリリースされました。

PyTorchと比較して2倍のパフォーマンスを実現(画像はNVIDIA サポートページより引用)

TensorRT-LLMは、NVIDIA DeveloperGitHubからダウンロード可能です。

詳細はNVIDIA Developerおよび公式ブログをご確認ください。

「NVIDIA TensorRT」NVIDIA Developer『Striking Performance: Large Language Models up to 4x Faster on RTX With TensorRT-LLM for Windows』NVIDIA 公式ブログ

関連記事

Unity公式AIエージェント「Unity AI」がオープンベータ開始。Unityの文脈に沿ったコーディングやアセット・シーン生成が可能
2026.05.05
OpenAI、「ChatGPT Pro」を月額16,800円で利用できる新料金プランを発表。従来の約半額でProの機能やCodexを利用可能
2026.04.10
NVIDIA、ゲーム開発者向けカンファレンス「GDC 2026」で実施した講演のアーカイブ動画を公開
2026.04.02
「ゲームメディア編集長に聞く!広報のお悩み相談会」、スライド資料が公開。「AI時代の広報・人事は社内取材のプロになるべき?スマートな“一次情報”の作り方」など3本
2026.03.30
ゲーム開発関連ツールのリリース・アップデートまとめ【2026/3/28】
2026.03.28
コロプラ、画像をAI学習から守る無料アプリ「COLOPL Contents Protector」リリース。技術的な学習阻害&法的な抑止力で作品を保護
2026.03.25

注目記事ランキング

2026.05.03 - 2026.05.10
VIEW MORE

連載・特集ピックアップ

イベントカレンダー

VIEW MORE

今日の用語

プロジェクト(Project)
プロジェクト
  1. 有限な期間で定められた目標を達成するための活動。
  2. ゲーム制作において、ひとつのタイトルを開発する活動。
  3. ゲームエンジンでは、ひとつのタイトルを開発するための環境一式。プロジェクトを開く起点となるファイルをプロジェクトファイルと呼ぶ。
VIEW MORE

Xで最新情報をチェック!