NVIDIA、大規模言語モデルの性能を最大4倍高速化する「TensorRT-LLM」をオープンソースでリリース。「Stable Diffusion」用Webアプリに使える拡張機能も併せて公開

2023.10.30

ニュース AI

この記事をシェア！

この記事の3行まとめ

NVIDIA、「TensorRT-LLM」をリリース

NVIDIAのGPUを使用し、大規模言語モデルの推論を高速化

「Stable Diffusion web UI」の生成速度を向上させる拡張機能も公開

NVIDIAは、大規模言語モデル（LLM）の推論を高速化するオープンソースライブラリ「TensorRT-LLM」をApache License 2.0でリリースしました。

（画像は公式ブログより引用）

TensorRT-LLMは、NVIDIAのGPUを使用して高速化を行います。同社は、LLMのパフォーマンスが最大で4倍高速化できたとしています。

また、パフォーマンス向上のほか、Retrieval-Augmented Generation（RAG）（※）などの手法をLLMに導入するのにも有用とのこと。
※　学習データには含まれていない情報をプロンプトとして与えることで、より正確な回答を生成させる手法

NVIDIAの公式ブログでは、Metaが開発するLLM「Llama2」と、TensorRT-LLMを利用しRAGを組み込んだLlama2の性能を比較。より正確かつ高速に回答を生成できたと報告しています。

「NVIDIA ACEはどのように感情的な反応を生み出すのか」という質問に対し、TensorRT-LLMを利用した場合（右）、利用しない場合（左）よりも正確な回答を出力している（画像は公式ブログより引用）

トップ

ニュース

注目記事

ゲームづくりの知識

チュートリアル

ルールをつくる

しくみをつくる

見た目を良くする

ゲームの舞台裏

インタビュー

講演レポート

クリエイティブモード

フォートナイト

マインクラフト

お役立ち情報

公開資料まとめ

イベントレポート

注目・定番の〇〇

アセットレビュー

ツール紹介

周辺機器・ハードウェア

NVIDIA、大規模言語モデルの性能を最大4倍高速化する「TensorRT-LLM」をオープンソースでリリース。「Stable Diffusion」用Webアプリに使える拡張機能も併せて公開

この記事の3行まとめ

NVIDIA、「TensorRT-LLM」をリリース NVIDIAのGPUを使用し、大規模言語モデルの推論を高速化 「Stable Diffusion web UI」の生成速度を向上させる拡張機能も公開

NVIDIAは、大規模言語モデル（LLM）の推論を高速化するオープンソースライブラリ「TensorRT-LLM」をApache License 2.0でリリースしました。

TensorRT-LLMは、NVIDIAのGPUを使用して高速化を行います。同社は、LLMのパフォーマンスが最大で4倍高速化できたとしています。

併せて、画像生成AI「Stable Diffusion」を使うWebアプリ「Stable Diffusion web UI」のパフォーマンスを、TensorRT-LLMで向上させる拡張機能「TensorRT Extension for Stable Diffusion Web UI」もMITライセンスでリリースされました。

TensorRT-LLMは、NVIDIA DeveloperやGitHubからダウンロード可能です。 詳細はNVIDIA Developerおよび公式ブログをご確認ください。

関連記事

注目記事ランキング

1

2

3

4

5

1

2

3

4

5

1

2

3

4

5

1

2

3

4

5

1

2

3

4

5

1

2

3

4

5

1

2

3

4

5

連載・特集ピックアップ

イベントカレンダー

今日の用語

レベル（Level）

Xで最新情報をチェック！

検索

NVIDIA、「TensorRT-LLM」をリリース

NVIDIAのGPUを使用し、大規模言語モデルの推論を高速化

「Stable Diffusion web UI」の生成速度を向上させる拡張機能も公開

TensorRT-LLMは、NVIDIA DeveloperやGitHubからダウンロード可能です。

詳細はNVIDIA Developerおよび公式ブログをご確認ください。