《the thinking game》:把世界看作一場「思考遊戲」

如果你關注 AI,then 推薦這部 DeepMind 紀錄片。

尤其適合家庭觀看,順便聊一聊 AI、遊戲、思考等話題。

圖片

這部紀錄片去年就在電影節放映了,但昨天 Google 把全片在 YouTube 上免費放出來了。

YouTube 影片

https://www.youtube.com/watch?v=d95J8yzvjbQ

非常有趣的是紀錄片的名稱:《思考遊戲》(the thinking game)。可以說,最讓人敬佩的,不是 Demis 得了諾貝爾獎,不是 Demis 的智商,而是那種「把世界當成一場思考遊戲」的眼光。

圖片

費曼一下

如果把整個人類文明看成一場漫長的「思考遊戲」,這部片子講的,就是一群人如何把這場「思考遊戲」本身拆開、重寫規則的故事。

對他們來說,棋盤、街機遊戲、星際爭霸、蛋白質折疊,甚至整座虛擬世界,都只是訓練一種東西的道具:通用智能。

圖片

Demis 的人生像一條被同一問題串聯的軌跡:少年國際象棋天才,在會堂裡熬到第十個小時,突然意識到,也許把幾百個頂尖大腦鎖在一間大廳裡只為分出輸贏,是在浪費心智;於是轉向遊戲設計,用主題公園裡的「嘔吐連鎖反應」去逼真模擬人類行為;再到劍橋研究大腦,從神經科學裡偷師,最後拉上 Shane,乾脆在倫敦創立 DeepMind,明目張膽地說:我們要做 artificial general intelligence。

他們選擇了一條看起來很「不務正業」的路徑:先讓系統學會在 Atari 裡打 Pong、挖 Breakout(打磚塊)的側翼隧道,再下去圍棋、打星際。強化學習、獎勵訊號、環境與智能體的閉環,在這些遊戲裡被一次次打磨:系統一開始連擋球都不會,只知道分數越高越好,最後卻能在圍棋上下出連職業棋手都無法想像的招法,能在星際裡練出堪比職業選手的多線操作。這裡有一種殘酷的坦誠:你不告訴機器規則,只給目標,它會自己找到通向高分的「人類從沒想過」的路徑。

但真正讓這條路線顯出重量的,是當他們把同樣的思維搬到現實科學問題上。蛋白質折疊這個自 20 世紀 60 年代就存在的難題,幾十年裡無數聰明人試過,都卡在實驗慢、資料少上。第一次參加 CASP 比賽,他們的 AlphaFold 確實贏了同行,卻只是在「一個沒人解好的問題上解得稍微好一點」。團隊後來回看那一屆,很坦白:我們知道自己還很爛,這只是最高的梯子,但月亮還在很遠的地方。

圖片

轉折來自第二次「總攻」:重寫資料管線,把物理與生物學的結構知識真正餵進模型,讓系統不再只是模仿,而是內化約束。最終在 CASP14 上,他們的結構精度幾乎等於按下按鈕得到實驗級結果,主持人說,經過半個世紀,這個問題可以宣布被解決了。接下來的一步更激進:既然可以在一個月裡預測全已知物種的蛋白質,那就別等別人排隊提交序列,直接把全地球的蛋白質都「折完」,免費公布,讓它成為人類生物學的基礎設施。

技術從來不是中性的玩具。AlphaGo 之後的「Sputnik moment」、AI 軍備競賽的隱喻、與曼哈頓計劃的對照、對 autonomous weapon 的明確拒絕,以及對 move fast and break things 的公開反感,都在提醒一個事實:當你試圖造出一种比人類更強的認知系統時,你不是在做一個新 app,而是可能在改寫歷史的分界線。連 DeepMind 自己的人都開始擔心:也許我們將來要做的,不是說服世界我們已經造出了智能,而是解釋我們還沒到那一步。

這部片子最有價值的地方不在於追星 DeepMind,而在於它把幾個關鍵問題扔在桌面上:什麼叫「通用」的學習能力?在一個只看獎勵的系統裡,價值是如何被編碼、被放大的?科學探索和工程衝刺之間,節奏如何拿捏,才不會「死在時間軸上」?當智能被外包給機器,人類該把注意力放在哪裡——是新的問題意識、新的制度與治理,還是對自身價值觀的重新書寫?

也許真正值得我們模仿的,不是某個演算法或產品,而是那種「把世界當成一場思考遊戲」的眼光:敢於承認自己暫時還很爛,敢於在失敗裡調整節奏,也敢於在成功時把成果毫無保留地推向全人類。

主標籤:思考遊戲

次標籤:DeepMind人工通用智能蛋白質折疊AlphaFold


上一篇:美空軍在高階兵棋推演中整合人工智慧

分享短網址