所有文章

AI

人工智慧模型

人工智慧教育

秘塔AI推出新功能：文件變課程...

大型語言模型

LLM評估

打破常規：為什麼LLM的最終答案可能不靠譜？...

人工智慧

AI模型

AI繪圖

豆包繪畫模型 3.0：AI 繪圖門檻再降低...

AI開發工具

傳聞 OpenAI 願斥 300 億美元收購？拆解 Windsurf：Codeium 如何轉型 AI IDE，憑“氛圍程式設計”殺出重圍...

AI工具

PPTAgent：會自己寫 PPT 的 AI 工具...

AI程式設計助理

Augment Code 漲價傳聞與替代方案...

網路安全

AI 研究

今日AI前沿進展快訊...

AI與文學

BBC推AI阿嘉莎克莉絲蒂懸疑寫作課，讓傳奇女王「復活」授課...

基於強化學習的多模態推理

基於強化學習的多模態大語言模型推理能力研究綜述...

嗅覺與社交

看不見的紅娘？體味與基因如何影響你的社交選擇...

AI模型評估

AI 界「奧運會」？OpenAI 發布全新基準測試 MRCR，模型「大海撈針」能力面臨極限挑戰！...

通用人工智慧的未來

大型語言模型根本不是通往通用人工智慧的終點站！...

自主通用科學家

自主通用科學家：AI與機器人重塑科學研究...

人工智慧發展

大語言模型

AI安全

企業AI

編程智能體

自我改進編程智能體...

合成數據

微軟亞洲研究院 SYNTHLLM：為語言模型驗證合成數據的規模法則...

人工智能

程式設計師要消失了？AI 教父Hinton、諾貝爾獎得主Pissarides和英偉達CEO黃仁勳齊聲示警...

人工智慧與就業

人工智慧引爆全球失業潮：美國大學生畢業即失業，多家企業因AI裁員上萬人...

AI 程式設計

人工智慧研究

資料重寫

重寫預訓練資料，大幅提升LLM在數學和程式碼上的效能...

AI 程式碼

AI 生成的程式碼：一誕生即為「遺留程式碼」？...

程式碼大型語言模型

字節Seed新方法！開源8B程式碼模型：自己篩數據訓練自己，同量級SoTA，還能超越百億級對手...

AI開發平台

變天了！WindSurf推出workflow功能，低代碼大模型應用開發平台將面對「降維」打擊...

人工智慧智能體

詳解 Minus AI: 邁向AGI新紀元？...

人工智慧策略

意識

人工智慧風險

圖靈獎得主、AI教父 Hinton：當超級智能覺醒時，人類可能無力掌控...

AI智能體

谷歌發布 76 頁智能體白皮書！你的「AI 替身」已上線...

資訊不對稱

雙方都賺錢的交易，為什麼有可能做不成？｜聶輝華...

AI推理

DeepSeek精度效率雙提升，華為&信工所提出思維鏈「提前退出」機制...

AI與信任

《人類簡史》作者尤瓦爾：當今世界最大的危險是人類互不信任，卻信比碳基生命進化快百萬倍的AI，我們拒絕真相，因為它昂貴複雜和痛苦...

AI工具使用

NVIDIA讓AI更聰明地使用工具：Nemotron-Research-Tool-N1模型深度解析...

第四維

第四維：時間、空間，還是意識？...

AI記憶

mem0推出重磅MCP工具OpenMemory，打造使用者私有、跨應用的共享記憶層...

科技新聞

全球裁員6000+人！這一次，連10年TypeScript老兵、AI總監都被微軟“優化”掉了...

分散式AI訓練

利用全球閒置算力訓練模型，性能媲美R1，老黃天塌了！Karpathy曾投資它...

人工智慧推理

螞蟻武威：下一代「推理」模型範式大猜想...

AI設計

一碼難求的Lovart又開始「限流」了，但設計師們卻說太值了...

文本轉語音

登上 Arena 榜首！MiniMax 最新 Speech-02 模型屠榜：超越 OpenAI、ElevenLabs，人聲相似度 99%...

Qwen3

Qwen3 技術報告解讀...

AI程式設計

AI可解釋性

苦研10年无果，千万经费打水漂！AI黑箱依然无解，谷歌撕破脸...

CoT百科全書

首個AI思維百科全書誕生，模型推理不再是黑箱...

AI 智能體

AI Agents 和 Agentic AI 有什麼區別？...

通用人工智慧 (AGI)

為什麼我們不太可能很快獲得通用人工智慧...

微軟Build

Windows子系統、Copilot皆重磅開源，深夜炸場的微軟給我們帶來了哪些驚喜？...

科學攝影

光影真相vs演算法幻象，AI時代的科學攝影...

LLM多輪對話

可靠的Agent應該用哪個模型？LLM多輪對話中的「迷失」現象 | 微軟最新...

AI編碼代理

GitHub 推出新的編碼代理...

影片生成AI

對話階躍星辰段楠：「我們可能正觸及 Diffusion 能力上限」...

多模态安全

多模态大模型集体翻车，GPT-4o仅50%安全通过率：SIUO揭示跨模态安全盲区...

語言模型擴展法則

一作解讀！從idea視角，聊聊Qwen推出的新Scaling Law——Parallel Scaling...

檢索增強生成 (RAG)

Google | 溯源分析RAG系統錯誤，提出選擇性生成框架，讓RAG問答準確率提升10%...

AI硬體

人工智慧與科學

被「AI for Science」的炒作騙了？有位科學家遭遇了慘痛的教訓...

AI Agent 框架

HALO，基於MCTS的層次化動態提示框架，讓Agent總能找到最優路徑 | 最新...

Go API 設計

API 設計的「Go境界」：Go 團隊設計 MCP SDK 過程中的取捨與思考...

AI監管

突發！美國新法案，10年內禁止監管AI...

神經美學

從貝葉斯推理到抽象畫，藝術是否只是大腦的自我投射？...

人工智慧影響

浙大團隊：AI使人缺乏動力、感到無聊！研究登上Nature子刊...

AI影片生成

Veo 3擬真脫口秀爆紅全網，網友：徹底超越恐怖谷！Sora已被完全超越...

理論電腦科學

50年僵局突破！麻省理工學院最新證明：演算法中，少量記憶體勝過大量時間...

合成資料生成

Statistically Controllable Data Synthesis! New Framework Breaks LLM Data Generation Limitations, McGill University Team Launches LLMSynthor...

人工智慧安全

歷史首次！o3模型找出Linux核心零時差漏洞，鑽研12000行程式碼百次終獲，無需呼叫任何工具...

AI 智慧體

312條軌跡激發241%性能！上交大與SII開源電腦智慧體，超越 Claude 3.7...

網路AI

微軟發布NLWeb：將任何網站轉化為AI應用程式的秘密武器！...

大型語言模型強化學習

萬字長文總結！推理模型強化學習實現路徑...

大型語言模型應用

Dify、n8n、扣子、Fastgpt、Ragflow 到底該怎麼選？超詳細指南來了。...

智慧代理

微軟開源瀏覽器代理程式，可即時追蹤、控制智慧代理，逾4000顆星...

AI模型優化

ICML 2025 | 又快又強的獅虎獸！僅20M詞元微調，Transformer秒切線性RNN...

人工智慧評估

ICML 2025 | 用『人類測驗法』戳破AI泡沫：建構能力導向的自適應評測新範式...

AI程式設計工具

Trae開始收費了，Cursor該緊張了！...

睡眠科學

按掉鬧鐘多睡會兒還是響了就起床？「再睡幾分鐘讓人起床時更清醒，認知表現更佳」對「頻繁打斷睡眠、反應更遲鈍」，兩項研究吵翻了！...

AI Agent

五大場景實測Manus、Flowith、Lovart：20 美元能否撬動Agent百倍效率？...

大型語言模型代理訓練

總結！2025年大型語言模型代理強化學習多輪規劃技術...

AI 模型訓練

LLM 結合 RL 遭質疑：刻意使用錯誤獎勵，數學基準竟也顯著提升，AI 圈為之震驚...

人工智慧與社會

Anthropic執行長失業「暴論」引爭議！AI恐在5年內淘汰一半白領入門職位，失業率或飆升至20%！阿莫多：該徵收代幣稅了...

多智能體AI

AI竟會「自己認錯」？破解多智能體協作「羅生門」，斬獲ICML 2025 Spotlight...

心智理論

將心智理論視為思維的思維語言：整合貝葉斯網路/因果文法模型與程式設計模式模型的優點領域特定語言...

模型架構

微軟等提出「模型鏈」新範式，與Transformer效能相當，擴展性與靈活性更佳...

AI推論

AI僅憑「自信」學會推理，浙大校友復刻DeepSeek長思維鏈湧現，強化學習無需外部獎勵訊號...

強化學習推理研究進展

整理RL推理的進展...

RAG訓練

過程監督>結果監督！華為港城重構RAG推論訓練，5k樣本效能超越90k模型...

基因體學AI

首個基因推理AI橫空出世！準確率飆升至97%，徹底改變基因體學研究...

數學研究

陶哲軒再發驚人消息：AlphaEvolve一個月內三度突破18年數學懸案，徹底改寫數學研究規則！...

AI自我改進

！離AGI更近了！！0.31元人民幣運行Google的AlphaEvolve和UBC的DGM「達爾文-哥德爾機」？...

智能代理瀏覽器

Fellou 2.0全面提升，成功率從31%到80%！AI開啟批次化生產...

複雜網路

尋找複雜網路的關鍵節點：量子深度強化學習的視角...

AI資安

微軟發布AI Agent故障白皮書，萬字剖析各種惡意智能體...

多模態人工智慧

資訊科技產業

電腦科學系意外失寵，失業率攀升至全美第七！畢業生苦讀四年，投遞千份履歷仍零錄取...

大型語言模型訓練

量子運算

航太科技

馬斯克的「星鏈」衛星突然大批墜落！...

端側AI

啟動端側長文本時代！面壁全新架構，讓小鋼炮最快提升220倍...

AI 影像生成

Google Veo 3 功能大升級！「360°」關鍵字解鎖 3D 效果，Fast 版本相同解析度價格狂降五倍...

大型語言模型優化

AI視訊生成

Seedance 1.0 Pro 第一手評測：位元組跳動首次榮登視訊大模型競技場的殺手級應用來了！...

人工智慧倫理

與圖靈獎得主約瑟夫·西法基斯對談：人工智慧能變得更聰明，但無法完全超越人類...

書籍推薦

經濟學人書單｜今年至今最值得閱讀的 40 本佳作...

科研預測

伯克利斯坦福聯手打造「科研預言家」：以77%準確度預測研究想法前景...

自由意志

自由意志的拼圖：誰在操控我們的選擇？...

人工智慧晶片

剛剛，AMD、OpenAI聯合發布超強AI晶片，推論提升35倍...

人工智慧代理人

專治不服！亞馬遜重磅發佈：AI SOP基準測試「高考」來了！頂尖Agent能考幾分？...

核能

谷歌、亞馬遜、微軟紛紛佈局，人工智慧的巨大能源需求會帶來核能的復興嗎？...

大型模型安全

AI 自主擔任網路管理員，實現安全「頓悟時刻」，風險率直降 9.6%...

人類世

人類世的意涵：儘管沒有正式地質定義，但它仍具重要性 | 自然長文...

智慧旅遊

當 AI 成為你的旅行管家，傳統訂票平台正被 iMeanAI Coyage 悄悄取代...

AI智能體架構

Devin共同創辦人：別再搞多智能體系統了！微軟和OpenAI鼓吹的代理建構理念大錯特錯！上下文工程將成新標準，員工：老闆停止洩密...

大型模型優化

僅10% KV 快取實現無損數學推理！開源方法解決推論大型模型「記憶過載」難題...

圖形RAG

最新12種GraphRAG技術全面評估...

大型語言模型最佳化

大力出奇蹟失效了嗎？ModelSwitch 跳出取樣黑洞，改寫大型模型推論範式...

AI多智能體系統

Anthropic 首次揭密多智能體系統細節：Claude 複刻人類集體智慧，效能超越單體 Opus 90%！...

深度工作

大腦最怕的是「頻繁切換」：深度專注的機制、練習與反直覺真相全梳理...

人工智慧自主進化

大型語言模型（LLM）已能自我更新權重，自適應、知識整合能力大幅提升，AI 醒了？...

主動推論

AGI理論比較：主動推論、強化學習、控制論、貝氏腦、效用決策、有限理性、情感動機、動態體內平衡...

腦中風治療

美國華裔女性科學家發明劃時代中風療法！血栓清除成功率達90%，有望徹底改變治療現況！...

推理圖

解讀大型推理模型的「思維奧秘」：從「推理圖」視角看模型的「啊哈時刻」...

軟體架構

微服務全做錯了！Google 提出新方法，成本直接降低 9 倍！...

AI 程式開發

Google 震撼推出 Gemini CLI：一款媲美 Cursor 的開源 AI 程式設計神器，個人使用者完全免費...

AI科學研究

AI科學家組團搞科研，爆肝萬字報告震驚醫學家！Nature獨家刊物揭露細節...

AI 軟體開發

Claude 的 AI 含量超越 Cursor 一倍！資深工程主管揭露 AI 編碼真相！Google 謹慎地全面投入自主研發；軟體架構教父：猶如從組合語言時代躍遷至高階語言...

AI 程式開發工具

Claude Code 四個月內狂攬 11.5 萬開發者，每週重寫 1.95 億行程式碼，正瘋狂搶佔通往 AGI 的關鍵途徑...

AI時代程式設計師

【萬字長思】AI 時代程式設計師的新定位：人機協作的 6 個核心原則...

資訊檢索

RAG開發者必看Google新論文MUVERA：讓多向量檢索與單向量搜尋一樣快...

人工智慧代理

阿里巴巴深夜開源「王牌」Agent！硬槓OpenAI，性能全面超越SOTA！...

持續強化學習

持續強化學習技術最新綜述...

大型語言模型數學推理

RL反直覺研究：直接給大型語言模型餵答案比提供詳細步驟更有用！...

畢業生就業

史上最黑暗的求職季！我是牛津碩士，失業半年、背負百萬債務，只因為人工智慧搶了我的飯碗...

AI模型架構

Transformer終結者！Google DeepMind全新MoR架構問世，新一代魔王來了...

資料科學

新書推薦：《駕馭資料科學：釋放人工智慧的創造潛力》 | 探索資料科學與人工智慧的融合之道...

基督教神學

新書推薦：《上帝、人工智慧與歷史的終結：在智慧機器時代理解〈啟示錄〉》...

大型語言模型架構

必讀好文：主流大型語言模型架構深度對比，涵蓋 Llama、Qwen、DeepSeek 等六大模型...

瀏覽器

重塑瀏覽器！微軟在Edge加入AI Agent，自動化搜尋、預測、整合...

人工智慧對齊

AI 技術

DeepSeek R2 秘密武器曝光！梁文鋒剛拿下頂級大獎的技術，讓 AI 讀長文速度狂飆 11 倍...

圖式檢索增強生成

RAG 革新！Graph-R1：首個由強化學習驅動的圖推理代理...

AI效能評測

Google 約戰，DeepSeek、Kimi 都要上，首屆大型模型對抗賽明天開戰...

兩性關係

牛津人類學家 Anna Machin：交友軟體正在讓你的大腦「擇偶演算法」失靈...

AI行為控制

大型語言模型的黑化開關！Anthropic團隊新作：大型語言模型的人格變數，人類終於找到了！提出人格漂移工具鏈，破解讓模型失控的黑箱...

自我進化AI代理

王夢迪團隊「自我進化代理」綜述：從靜態大型語言模型到超智慧人工智慧...

AI大模型

小紅書開源首個多模態大模型dots.vlm1，效能逼近SOTA！...

人工智慧創業

OpenAI 董事會主席：以「代幣計費」大錯特錯！市場終將選擇「以成果計費」...

思維鏈推理

思維鏈推理的「海市蜃樓」：大型語言模型泛化能力的深入探討...

鐵達尼號

數據會說話：「男人活得不如狗」｜七組數據...

Meta AI 組織變革

LeCun 未來發表論文須經亞歷山大王批准！Meta 做出令人傻眼的操作...

AI Reasoning

顛覆思維鏈！字節跳動提出逆向工程推理！AI學會從結果倒推過程...

AI模型問題

Anthropic 再次說明 Claude 近期三起故障，並稱 Claude Code 已全面恢復...

AI程式開發

Agentic Coding表現創新高，全新KAT系列模型強力稱霸SWE-Bench...

程式碼壓縮

上交大與史丹佛提出「長程式碼壓縮神器」：暴力瘦身 5.6 倍且效能不減...

細胞生物學

細胞世界的「高速公路」：揭密微小紋路如何讓混亂的細胞群自發排隊，走向有序...

深度學習模型

NeurIPS'25！AutoPrune：即插即用的自適應大模型剪枝框架...

文件智能

極其重要，文件智能中的LLMs：綜述、進展、和未來趨勢...

AI 代理程式

谷歌加入 CUA 戰場，發布 Gemini 2.5 Computer Use：讓 AI 直接操作瀏覽器...

AI 應用程式

Claude Code 即將登陸 Claude App...

AI 架構

Mamba 架構登上頂級會議 ICLR 2026，AI 大腦核心 Transformer 的王座還能坐穩嗎？...

深度搜尋智能體

智能體長程搜尋的兩大痛點被解決了！中科院 DeepMiner 用 32k 跑近百輪，開源領先逼近閉源...

資訊安全

NTU等聯合提出A-MemGuard：為AI記憶上鎖，毒害攻擊成功率暴降95%...

多模態大型模型

捨棄人工標註！華人團隊提出多模態大模型自我演化演算法...

神經網路架構搜尋

NAS新視角：圖神經網路驅動的通用架構空間，卷積與Transformer混合架構性能躍升！...

人工智慧科學家

AI科研革命：牛津團隊用「世界模型」一夜完成半年科學研究！...

智能體學習

Meta 這兩篇最新的智能體學習 (Agent Learning) 論文，有些意思！...

空間智慧

AI教母李飛飛萬字長文引爆矽谷！大型語言模型路線錯了，空間智慧才是走向AGI的唯一路徑...

GAD框架

微軟提出GAD框架：開源模型也能直接蒸餾黑盒GPT-5...

AI 超級工廠

微軟 CEO 納德拉：這一次工業革命，從「AI 超級工廠」開始...

DeepEyesV2

小紅書提出DeepEyesV2，從「看圖思考」到「工具協同」，探索多模態智能新維度...

稀疏電路

透過稀疏電路理解神經網路...

長時程推理

牛津大學提出 H1 「自舉（Bootstrapping）」框架，讓模型自我進化，能力憑空生有！...

Claude 技能

Claude 推出 Skills 功能，以及 Agent Skills 開發指南...

DeepCode

AI首勝人類博士，頂會論文秒變程式碼！港大90後開源刷爆8k星...

英偉達投資AI編碼新創

英偉達擬砸 10 億美元給這家 AI 編碼新創！Copilot 技術大佬領軍、成立兩年估值近千億...

柏拉圖表徵假說

【深度】Ilya Sutskever 精選論文：柏拉圖表徵假說...

Claude Opus 4.5

程式設計測試碾壓人類！Claude Opus 4.5 深夜突襲，AI 程式設計進入「超人時代」...

Gemini 3

Gemini 3 的意義：AI 已超越「幻覺階段」，逼近人類，「人機協作」將從「人對 AI 糾錯」走向「人指導 AI 工作」...

單卡超並行微調

單卡跑出叢集效率！Hugging Face TRL 與 RapidFire AI 的超並行革命...

VideoCAD

大模型也能搞定螺絲釘？！MIT頂會論文讓AI學會工業CAD軟體操作...

LLM 議會

Karpathy 組建大模型「議會」，GPT-5.1、Gemini 3 Pro 等化身最強智囊團...

錯誤進化

通往 AGI 的歧路：上海 AILab 重大發現，自進化智能體可能「錯誤進化」...

AI創作工具

一人搞定整個劇組！北大哲學博士打造AI神器，20萬人排隊搶用...

RLVR

什麼？RLVR 竟然不是在學習新知識？而是在學習如何使用知識進行推理！...

Code2Video

比文生影片更實用！！這個「用程式碼生成影片」的開源工具火了，我嗅到了商機。...

AI宗教科技

連上帝都去IPO敲鐘了，這屆AI生意太魔幻了...

因果推理

論文淺嘗 | 利用條件陳述激發並提升大型語言模型的因果推理能力（CL2025）...

嵌套學習

BISHENG

GitHub 上狂吸 1 萬 Star，這個國產 AI 應用開發平台超棒啊。...

Ilya Sutskever 訪談

Ilya 最新訪談：為什麼人類幾小時就能學會的事，萬卡叢集卻做不到？我們正從「算力規模化時代」重返「研究時代」...

人工智慧與人類智能

MIT神經科學家發現，人類智能與人工智慧在嚴酷邏輯法則面前驚人重合...

雙 Agent 架構

Anthropic 官方最新工程方案解釋為什麼 Claude Code 好用：使用雙 Agent 架構讓 AI 實現真正的長時自主工作...

SparseDiT

推理加速175%！SparseDiT提出「時空雙重稀疏化」新範式，重塑DiT效率...

Fara-7B

微軟 Fara-7B 電腦操作模型，開啟端側智能代理新時代...

生成式機器人

【CMU 博士論文】《生成式機器人：用於人機協同創作的自監督學習》...

大型語言模型單元測試生成

用於單元測試生成的大型語言模型：成果、挑戰與未來方向...

美空軍人工智慧兵棋推演

美空軍在高階兵棋推演中整合人工智慧...

思考遊戲

《the thinking game》：把世界看作一場「思考遊戲」...

ABCA 框架

因果推斷殺入 LLM 戰場！大模型幻覺終結者？ABCA 框架...

DeepSeek 模型發佈

重磅！DeepSeek 正式發佈 2 個模型...