世界中のアイドル計算能力でモデルを学習、性能はR1に匹敵、ジェンセン・ファンの空が崩壊!Karpathyもかつて投資

一晩にして、ジェンセン・ファン氏の空が崩壊しました(doge)。

世界初の分散型RL学習モデル、INTELLECT-2がリリースされました。これは、世界中のアイドル状態または分散された計算リソースを統合するだけで、モデルの強化学習学習を完了させ、学習コストを大幅に削減しました。

そのモデル性能はDeepSeek-R1に匹敵します!

このパラダイムが確立されれば、RL学習は集中型計算能力への依存から解放されることを意味します。世界中の誰もがモデル学習に参加できるようになり、大企業による計算能力の独占時代は終焉を迎えるかもしれません。

Just like this~ 計算能力が来る、計算能力が来る、計算能力が四方八方から来る。

このモデルバージョンには、19の個人/機関が計算リソースのサポートを提供しました(モデルの回答から、およびそれ自体も含まれます)

計算能力への貢献に加えて、Karpathy氏、FlashAttentionの著者Tri Dao氏、HuggingFaceの共同創設者兼CEOであるClem Delangue氏など、多くの大物が投資を惜しまないとのことです。

チームメンバーによると、モデルの強化学習フレームワークprime-rlの記述から今日のリリースまで、わずか2ヶ月しかかからなかったそうです。

現在、インフラストラクチャは整っており、検証も済んでいます。これらの高度な研究室を超えるのは時間の問題です。

INTELLECT-2は現在ウェブブラウザでの利用をサポートしており、簡単な登録で使用できます。他の汎用アシスタントページと似ていますが、入力はテキストのみをサポートしています。

それでは、基本的な質問から始めましょう:INTELLECT-2の最大の特徴は何ですか?

数秒間思考した後、回答が得られました。まず、これは初の分散型RL学習による超大規模モデルであることを強調し、次に強化学習学習、パラメータスケールと性能のバランス、データプライバシーとセキュリティ、コミュニティ主導といった特徴を挙げました。

回答は基本的にOKです。それでは、少し難易度を上げてみましょう:

宇宙人が地球に到着した後、最初の日に以下の4つのうちの1つを実行する可能性が等しいとします:1、自己破壊する;2、2体の宇宙人に分裂する;3、3体の宇宙人に分裂する;4、何も

メインタグ:分散型AI学習

サブタグ:強化学習Prime IntellectAIモデルアイドル計算能力


前の記事:世界で6000人以上を解雇!今回は10年のTypeScriptベテランやAIディレクターまでもがマイクロソフトに「最適化」された

次の記事:プロの医師はAIモデルにはるかに劣る?OpenAIが医療オープンソースベンチマークHealthBenchを発表、o3が最高のパフォーマンスを示す

短いURLをシェア