Databricks、無料で使えるオープンソースの大規模言語モデル『Dolly 2.0』をリリース。自社製データセットにより商用利用が可能に

Databricks、無料で使えるオープンソースの大規模言語モデル『Dolly 2.0』をリリース。自社製データセットにより商用利用が可能に

2023.04.13
ニュースAI
この記事をシェア!
Twitter Facebook LINE B!
Twitter Facebook LINE B!

この記事の3行まとめ

  • Databricks、命令追従型LLM『Dolly 2.0』をリリース
  • Dolly 1.0ではできなかった商用利用が可能に
  • 商用利用のためにデータセット「databricks-dolly-15k」を作成

Databricksは、大規模言語モデル(以下、LLM)「Dolly」の最新バージョンである『Dolly 2.0』をリリースし、同社ブログにて発表しました。

Dolly 2.0は、商用利用可能なオープンソースの命令追従型LLMです。リリースしたDatabricksによれば、Dolly 2.0が初の商用利用可能なオープンソースである命令追従型LLMとのこと。

Dolly 1.0をリリースした際、「商用利用が可能かどうか」という質問が多く寄せられました。Dolly 1.0は、OpenAI APIを利用したデータセットでトレーニングされていたので、同APIの利用規約に抵触しており、商用利用はできませんでした。

これを踏まえてDolly 2.0では、EleutherAIのpythiaモデルファミリーをベースに、5,000人以上のDatabricks従業員によって作られたレコードも含んだデータセットでトレーニングしたことで、商用利用を可能にしています。

こうして生まれたデータセット「databricks-dolly-15k」は、Dolly 1.0で使われたデータセットも小さいものですが、高品質であるといいます。

詳細は、「Free Dolly: Introducing the World’s First Truly Open Instruction-Tuned LLM」をご確認ください。

Free Dolly: Introducing the World's First Truly Open Instruction-Tuned LLM

関連記事

企業でもAIやLLMを活用できる“仕組み”を作る。CygamesのAI導入手順と運用アーキテクチャ【CEDEC2025】
2025.08.08
『ストリートファイター6』“人間らしいAI”と“成長の楽しみ”が対人戦ハードルを下げる。「Vライバル」ができるまで【CEDEC2025】
2025.08.05
アンリアルエンジンの更新内容を自動でチェックしてAIが要約!おかず氏、「Unreal Engine Update Tracker」を公開
2025.07.23
エージェント型AI搭載のIDE「Kiro」プレビュー版がリリース。要件を補って仕様書を作り実装、リリースの定型作業も自動化
2025.07.17
Core Ultra 200Hシリーズ搭載のミニPC「GEEKOM IT15」、10万円台から販売中。AIアップスケーリング技術「Intel XeSS 2」に対応
2025.07.14 [PR]
ゲームAI活用の最新事例を総括。スクウェア・エニックスの三宅 陽一郎氏による講演をレポート【GFS2025】
2025.07.10

注目記事ランキング

2025.08.24 - 2025.08.31
VIEW MORE

連載・特集ピックアップ

イベントカレンダー

VIEW MORE

今日の用語

ロード(Load)
ロード
  1. コンピューターの補助記憶装置(HDDなど)に保存されたデータを読み込んで、主記憶装置(メインメモリ)上に展開すること。
  2. ゲームにおいて、セーブデータを読み込んで中断時の状況を再現すること。
VIEW MORE

Xで最新情報をチェック!