NVIDIA、大規模言語モデルの性能を最大4倍高速化する「TensorRT-LLM」をオープンソースでリリース。「Stable Diffusion」用Webアプリに使える拡張機能も併せて公開

2023.10.30

ニュース AI

この記事をシェア！

この記事の3行まとめ

NVIDIA、「TensorRT-LLM」をリリース

NVIDIAのGPUを使用し、大規模言語モデルの推論を高速化

「Stable Diffusion web UI」の生成速度を向上させる拡張機能も公開

NVIDIAは、大規模言語モデル（LLM）の推論を高速化するオープンソースライブラリ「TensorRT-LLM」をApache License 2.0でリリースしました。

（画像は公式ブログより引用）

TensorRT-LLMは、NVIDIAのGPUを使用して高速化を行います。同社は、LLMのパフォーマンスが最大で4倍高速化できたとしています。

また、パフォーマンス向上のほか、Retrieval-Augmented Generation（RAG）（※）などの手法をLLMに導入するのにも有用とのこと。
※　学習データには含まれていない情報をプロンプトとして与えることで、より正確な回答を生成させる手法

NVIDIAの公式ブログでは、Metaが開発するLLM「Llama2」と、TensorRT-LLMを利用しRAGを組み込んだLlama2の性能を比較。より正確かつ高速に回答を生成できたと報告しています。

「NVIDIA ACEはどのように感情的な反応を生み出すのか」という質問に対し、TensorRT-LLMを利用した場合（右）、利用しない場合（左）よりも正確な回答を出力している（画像は公式ブログより引用）

併せて、画像生成AI「Stable Diffusion」を使うWebアプリ「Stable Diffusion web UI」のパフォーマンスを、TensorRT-LLMで向上させる拡張機能「TensorRT Extension for Stable Diffusion Web UI」もMITライセンスでリリースされました。

PyTorchと比較して2倍のパフォーマンスを実現（画像はNVIDIA サポートページより引用）

TensorRT-LLMは、NVIDIA DeveloperやGitHubからダウンロード可能です。

詳細はNVIDIA Developerおよび公式ブログをご確認ください。

「NVIDIA TensorRT」NVIDIA Developer 『Striking Performance: Large Language Models up to 4x Faster on RTX With TensorRT-LLM for Windows』NVIDIA 公式ブログ

注目記事ランキング

2025.06.28 - 2025.07.05

全体ニュース注目記事ゲームづくりの知識ゲームの舞台裏クリエイティブお役立ち情報

西川善司が語る“ゲームの仕組み”の記事をまとめました。

ゼロから分かるBlender講座

Blenderを初めて使う人に向けたチュートリアル記事。モデル制作からUE5へのインポートまで幅広く解説。

アークライト野澤流ボードゲームを作るには

アークライトの野澤邦仁（のざわくにひと）氏が、ボードゲームの企画から制作・出展方法まで解説。

ゲーム制作定番の○○

ゲーム制作の定番ツールやイベント情報をまとめました。

GAME CREATORS CONFERENCE ’25

GAME CREATORS CONFERENCE ’25で行われた講演レポートをまとめました。

GDC 2025

GDC 2025で行われた講演レポートをまとめました。

UNREAL FEST 2024

UNREAL FEST 2024で行われた講演レポートやインタビューをまとめました。

東京ゲームショウ2024

東京ゲームショウ2024で展示された作品のプレイレポートやインタビューをまとめました。

CEDEC2024

CEDEC2024で行われた講演レポートをまとめました。

BitSummit2024

BitSummitで展示された作品のプレイレポートをまとめました。

ゲームメーカーズスクランブル2024

ゲームメーカーズスクランブル2024で行われた講演のアーカイブ動画・スライドをまとめました。

CEDEC2023

CEDEC2023で行われた講演レポートをまとめました。

東京ゲームショウ2023

東京ゲームショウ2023で展示された作品のプレイレポートやインタビューをまとめました。

UNREAL FEST 2023

UNREAL FEST 2023で行われた講演レポートをまとめました。

BitSummit2023

BitSummitで展示された作品のプレイレポートをまとめました。

ゲームメーカーズスクランブル2023

ゲームメーカーズスクランブルで行われた講演のアーカイブ動画・スライドをまとめました。

UNREAL FEST 2022

UNREAL FEST 2022で行われた講演レポートやインタビューをまとめました。

CEDEC2022

CEDEC2022で行われた講演レポートをまとめました。

イベントカレンダー

今日の用語

レンダリング（Rendering）

レンダリングコンピューターグラフィックスにおける、各種データ（3Dモデルなど）をプログラムを用いて計算し、画像として表示すること。レンダリングを行うプログラムをレンダラー（Renderer）と呼ぶ。

Xで最新情報をチェック！

サイト内検索

トップ

ニュース

注目記事

ゲームづくりの知識

チュートリアル

ルールをつくる

しくみをつくる

見た目を良くする

ゲームの舞台裏

インタビュー

講演レポート

クリエイティブモード

フォートナイト

マインクラフト

お役立ち情報

公開資料まとめ

イベントレポート

注目・定番の〇〇

アセットレビュー

ツール紹介

周辺機器・ハードウェア