Databricks、無料で使えるオープンソースの大規模言語モデル『Dolly 2.0』をリリース。自社製データセットにより商用利用が可能に

Databricks、無料で使えるオープンソースの大規模言語モデル『Dolly 2.0』をリリース。自社製データセットにより商用利用が可能に

2023.04.13
ニュースAI
この記事をシェア!
Twitter Facebook LINE B!
Twitter Facebook LINE B!

この記事の3行まとめ

  • Databricks、命令追従型LLM『Dolly 2.0』をリリース
  • Dolly 1.0ではできなかった商用利用が可能に
  • 商用利用のためにデータセット「databricks-dolly-15k」を作成

Databricksは、大規模言語モデル(以下、LLM)「Dolly」の最新バージョンである『Dolly 2.0』をリリースし、同社ブログにて発表しました。

Dolly 2.0は、商用利用可能なオープンソースの命令追従型LLMです。リリースしたDatabricksによれば、Dolly 2.0が初の商用利用可能なオープンソースである命令追従型LLMとのこと。

Dolly 1.0をリリースした際、「商用利用が可能かどうか」という質問が多く寄せられました。Dolly 1.0は、OpenAI APIを利用したデータセットでトレーニングされていたので、同APIの利用規約に抵触しており、商用利用はできませんでした。

これを踏まえてDolly 2.0では、EleutherAIのpythiaモデルファミリーをベースに、5,000人以上のDatabricks従業員によって作られたレコードも含んだデータセットでトレーニングしたことで、商用利用を可能にしています。

こうして生まれたデータセット「databricks-dolly-15k」は、Dolly 1.0で使われたデータセットも小さいものですが、高品質であるといいます。

詳細は、「Free Dolly: Introducing the World’s First Truly Open Instruction-Tuned LLM」をご確認ください。

Free Dolly: Introducing the World's First Truly Open Instruction-Tuned LLM

関連記事

「Unity 6.2 Beta」リリース。従来のAIツール「Unity Muse/Sentis」は廃止され、新機能「Unity AI」に置き換わる
2025.05.16
リギングを自動化できるAIツール「UniRig」がオープンソース化。人型キャラクターや動物など、幅広い3Dモデルでスケルトン生成・スキニングが可能
2025.04.22
「GitHub Copilot」各AIモデルの強みや運用方法をGitHubが分析。GPT、Gemini、Claudeの効果的な使い分け方をブログ記事で解説
2025.04.22
NVIDIA、GPU「GeForce RTX™ 5060/5060 Ti」を発表。「RTX 5060 Ti」は本日発売、価格は379ドルから
2025.04.16
「GeForce RTX™ 50」発表時に披露された技術デモ「Zorah」制作事例、NVIDIAの技術者がブログ記事で解説。Substance Painterによる高精細なテクスチャリングなど
2025.04.11
3Dモデル生成AI技術2種類がオープンソース化。1枚の画像からモデルを出力できる「TripoSG」に、複雑な形状などの生成に適した「TripoSF」も
2025.04.09

注目記事ランキング

2025.05.18 - 2025.05.25
VIEW MORE

連載・特集ピックアップ

イベントカレンダー

VIEW MORE

今日の用語

プラットフォーム(Platform)
プラットフォーム
  1. サービスやシステムを動作させるための共通基盤とその環境のこと。
  2. ゲームにおいては、特定のゲームハードやゲームを販売しているストアのことを示す。
VIEW MORE

Xで最新情報をチェック!