分類: 人工智慧
- MCP堆疊工具是個大坑!開發者大佬:命令列的「脆弱」讓AI慘敗!不如砍掉變成一個程式碼執行器:7輪呼叫秒變1輪!網友:早該放棄黑箱工具了!
- 橫掃數學榜的LLM,卻忘了如何聊天?CMU等揭示SFT與RL的驚人差異!
- 獎勵模型新革命!SWIFT不讀文本讀「心聲」,打造又快又強又省錢的AI裁判
- GPT-5 等於擴展法則失靈?畢樹超:永遠有效,因為它反映的是資料結構,是客觀規律
- 奧特曼驚人預言:GPT-8將於2035年治癒癌症!人類或為算力爆發引發第三次世界大戰
- 史上最大高品質科學推理後訓練資料集開源,快速讓Qwen3等變「科學家」
- 谷歌開源 DeepPolisher,基因組組裝錯誤率減半,Jeff Dean:令人振奮!
- AI 修復錯誤新 SOTA:SWE-Bench Lite 修正率達 60.33%,能像人一樣累積經驗,中科院軟體所出品
- ReaGAN:讓圖中每個節點都成為智能推理專家
- 阿里雲剛開源Qwen-Image,免費版GPT-4o吉卜力,中文最佳模型
- Dualformer:透過隨機推理軌跡學習實現可控的快速與慢速思考
- 重塑瀏覽器!微軟在Edge加入AI Agent,自動化搜尋、預測、整合
- 新書推薦《重塑:當人工智慧重構知識經濟時誰將勝出》
- 新書推薦:《上帝、人工智慧與歷史的終結:在智慧機器時代理解〈啟示錄〉》
- 新書推薦:《駕馭資料科學:釋放人工智慧的創造潛力》 | 探索資料科學與人工智慧的融合之道
- Meta團隊突破:大型模型「幻覺」暴跌至5%!一句話提問竟成關鍵?
- 使用AI撰寫程式碼效率反而下降19%!246項任務實測,16位資深程式設計師參與
- 數學訓練如何「解鎖」大型模型的通用推理能力?最新研究揭示關鍵機制
- 持續強化學習技術最新綜述
- 開發者遭 ChatGPT「趕鴨子上架」!AI 編造假功能,吸引大量用戶,被迫將其開發出來
- 清華大學研究:再次翻轉?證實強化學習並未真正提升基礎模型推論能力!
- 清華等提出 Absolute Zero 自博弈大型模型,完全零資料訓練仍登頂多項任務
- Bengio親自戳破CoT神話!大型語言模型推論是假象,25%頂尖會議論文遭打臉
- 大型模型首次直接理解程式碼圖:無需代理程式自動修復錯誤,榮登SWE-Bench開源模型榜單
- 繼AlphaFold之後,DeepMind再放大「大招」:AlphaGenome直擊疾病根源