カテゴリー: ディープラーニング
- ハードコア分析大規模言語モデル:DeepSeek-V3からKimiK2まで、主流LLMアーキテクチャを一本で理解する
- GoogleがDeepPolisherをオープンソース化、ゲノムアセンブリのエラー率を半減、ジェフ・ディーン氏「感動的だ!」
- Qwenが深夜に更新:RTX 3090で動作可能、3BパラメータでGPT-4oに匹敵
- 今世紀最高のAIインタビューの一つ:AIの安全性、エージェント、OpenAIなど重要テーマ
- Kaiming Heの新作:拡散モデルに正則化を追加、事前学習やデータ拡張不要で、超シンプルに性能向上を実現
- R1型訓練はもはや結果の正誤だけでなく!香港中文大学がSophiaVL-R1モデルを発表
- 手動アノテーション不要!AIが自己生成した学習データで、「演繹・帰納・アブダクション」による推論能力を解き放つ
- 彼女はいかにして「システム2」を大規模言語モデルにもたらしたか | マイクロソフトリサーチアジアの張麗氏との対話
- クアンタ:ホップフィールドネットワーク:AIを生み出した創発物理学
- Google | RAGシステムのエラーを追跡:選択的生成フレームワークを提案し、RAGの精度を10%向上