Databricks、無料で使えるオープンソースの大規模言語モデル『Dolly 2.0』をリリース。自社製データセットにより商用利用が可能に

Databricks、無料で使えるオープンソースの大規模言語モデル『Dolly 2.0』をリリース。自社製データセットにより商用利用が可能に

2023.04.13
ニュースAI
この記事をシェア!
Twitter Facebook LINE B!
Twitter Facebook LINE B!

この記事の3行まとめ

  • Databricks、命令追従型LLM『Dolly 2.0』をリリース
  • Dolly 1.0ではできなかった商用利用が可能に
  • 商用利用のためにデータセット「databricks-dolly-15k」を作成

Databricksは、大規模言語モデル(以下、LLM)「Dolly」の最新バージョンである『Dolly 2.0』をリリースし、同社ブログにて発表しました。

Dolly 2.0は、商用利用可能なオープンソースの命令追従型LLMです。リリースしたDatabricksによれば、Dolly 2.0が初の商用利用可能なオープンソースである命令追従型LLMとのこと。

Dolly 1.0をリリースした際、「商用利用が可能かどうか」という質問が多く寄せられました。Dolly 1.0は、OpenAI APIを利用したデータセットでトレーニングされていたので、同APIの利用規約に抵触しており、商用利用はできませんでした。

これを踏まえてDolly 2.0では、EleutherAIのpythiaモデルファミリーをベースに、5,000人以上のDatabricks従業員によって作られたレコードも含んだデータセットでトレーニングしたことで、商用利用を可能にしています。

こうして生まれたデータセット「databricks-dolly-15k」は、Dolly 1.0で使われたデータセットも小さいものですが、高品質であるといいます。

詳細は、「Free Dolly: Introducing the World’s First Truly Open Instruction-Tuned LLM」をご確認ください。

Free Dolly: Introducing the World's First Truly Open Instruction-Tuned LLM

関連記事

OpenAI、「ChatGPT Pro」を月額16,800円で利用できる新料金プランを発表。従来の約半額でProの機能やCodexを利用可能
2026.04.10
NVIDIA、ゲーム開発者向けカンファレンス「GDC 2026」で実施した講演のアーカイブ動画を公開
2026.04.02
「ゲームメディア編集長に聞く!広報のお悩み相談会」、スライド資料が公開。「AI時代の広報・人事は社内取材のプロになるべき?スマートな“一次情報”の作り方」など3本
2026.03.30
ゲーム開発関連ツールのリリース・アップデートまとめ【2026/3/28】
2026.03.28
コロプラ、画像をAI学習から守る無料アプリ「COLOPL Contents Protector」リリース。技術的な学習阻害&法的な抑止力で作品を保護
2026.03.25
『ドラクエ10』対話型AIバディ「おしゃべりスラミィ」開発秘話。スクエニ・Googleが目指す革新的ゲーム体験とは
2026.03.23

注目記事ランキング

2026.04.25 - 2026.05.02
VIEW MORE

連載・特集ピックアップ

イベントカレンダー

VIEW MORE

今日の用語

ローカル座標
ローカルザヒョウ 各オブジェクトの原点を基点とした座標系における、特定の一点を示した座標。
VIEW MORE

Xで最新情報をチェック!