使用AI撰寫程式碼效率反而下降19%！246項任務實測，16位資深程式設計師參與

使用AI，有經驗的開發者反而被拖慢了？

在一項基於真實開源專案的實驗中，研究者發現使用AI工具不僅沒有提升開發效率，反而讓任務時間增加了19%。

這簡直與人們預測的結果完全相反。

網友也表示，沒有AI輔助撰寫程式碼，真是痛苦萬分。

接下來我們來看看，這個與大多數人直覺相悖的結果是如何得出的。

16位經驗開發者實測AI使用效率

為了直接評估AI工具對開發者生產效率的影響，研究者讓16位經驗豐富的開發人員完成246項任務，這些任務都是在知名開源程式碼儲存庫中（平均23000星，1100000行程式碼）。

每項任務被隨機分配是否允許使用AI工具。若需要使用AI工具，主要是使用Cursor Pro搭配Claude 3.5/3.7 Sonnet。

隨後，研究團隊記錄開發者在不同條件下完成任務所花費的時間，並收集他們工作時的螢幕錄影。

在這個實驗中，每位開發者都會提供一份自己程式碼儲存庫中的真實任務清單，作為本次研究的工作內容。

這些任務通常是錯誤報告、功能請求或用於協調開發的工作項目，內容從簡短的問題描述到詳細的分析不等，所需時間也從幾分鐘到數小時不等。

收集完任務清單後，開發者會預測在有AI輔助和沒有AI輔助的情況下，完成每個任務所需的時間。

隨後，這些任務透過模擬拋硬幣的方式，隨機分配到允許或不允許使用AI的兩種條件中。

開發者可按照自己的喜好順序處理分配到的任務，允許靈活安排工作，甚至有時會同時處理多個任務。

當他們認為某個任務已完成並滿意後，會向相應的程式碼儲存庫提交一個請求，該請求通常會由其他開發者進行審查。

使用AI工具竟然比不使用慢19%

開發者在允許使用AI的條件下完成了136個任務，在不允許使用AI的條件下完成了110個任務。

有趣的是，開發人員預測自己的效率會提升24%，但結果卻正好相反。

研究發現，當開發者使用AI工具時，完成任務的平均時間增加了19%。

不僅如此，幾乎所有完成時間的分位數中，允許使用AI的任務耗時都更長。

下圖顯示了在有效螢幕錄影中，開發人員為每種類型的問題所花費的時間比。

可以看出，當允許使用AI時，開發人員會花費較少的時間主動編碼和閱讀/搜尋資訊。相反地，他們花時間審查AI輸出，提示AI系統並等待AI生成。

鑑於這一令人震驚的結果，研究人員進一步探究了可能導致開發者在允許使用AI時花費更多時間的20個相關因素，他們將這些因素分為四類：

直接生產力損失：指使用AI工具過程中，因其本身機制導致開發效率下降。

實驗偏差因素：指實驗設計或執行中的混雜變數，可能引入偏差或影響結果的外部有效性。

提升開發者表現的因素：指任務、程式碼儲存庫或實驗環境中的特性，使開發者相較AI更具優勢。

限制AI表現的因素：指任務、程式碼儲存庫或AI工具/環境中的特性，削弱了AI相對於人類開發者的有效性。

他們在對20個因素進行分析後，發現其中5個因素有定性及定量的證據表明它們確實導致了效率減慢，9個因素的影響證據不明確或存在混合情況，另有6個因素則有證據表明它們並未造成效率下降。

補充資訊

與此同時，《華爾街日報》也報導，就算使用AI節省了時間，換來的卻是更多工作。

對於這些苦命的上班族來說簡直是天大的噩耗，實在是讓人笑不出來。

隨著越來越多職場人士開始使用AI助理完成日常任務，平均每天可節省大約一小時工作時間（據商業軟體製造商SAP調查）。

但企業並沒有給員工更輕鬆的工作安排，相反地，管理階層往往期待他們用節省的時間創造更多產出。

在亞馬遜，執行長Andy Jassy公開敦促員工：

「想辦法如何利用人工智慧更快速、更廣泛地為客戶進行創新，並以更精簡的團隊完成更多工作。」

參考連結：