AI秘密操控Reddit用戶意見長達四個月未被察覺

哈？AI秘密潛入Reddit社群，「操縱」用戶觀點4個月。

離譜的是，人類全程毫無察覺，而且被AI說服改變想法的機率，高達正常基準的6倍！

Reddit Lies在X上發布了一則貼文，引發二百多萬網友圍觀。

事情經過是這樣的。

Reddit的r/changemyview（CMV）版主最近曝光了一項研究，稱蘇黎世大學研究人員在2024年11月至2025年3月期間，瞞著CMV社群用戶，搞了一場未經授權的實驗。

他們違背CMV社群規則，部署了AI帳號生成評論以研究AI如何影響和改變人們的觀點。

Reddit Lies在伺服器上查詢了CMV版主曝光的13個實驗用的機器人使用者名稱，發現僅在幾個月的時間裡，這些機器人就發布了近1500條評論。

超100位Reddit用戶給這些AI帳號授予了“∆”，這表明AI生成的論點成功改變了他們的觀點，是基線水平的6倍。

關鍵是，Reddit Lies還表示有的AI會直接向用戶撒謊，散播虛假資訊……

且根據團隊發布的研究，在實驗期間，r/changemyview社群的網友完全沒察覺到那些評論竟然是AI帳號發出來的。

消息一出，瞬間炸鍋。馬斯克也「天吶」一聲冒了個泡。

先來看一下這項實驗。

研究在Reddit平台上的r/changemyview社群進行，該社群擁有近400萬用戶，按規模位列Reddit子版塊前1%。

在r/changemyview中，用戶就各類話題分享觀點，透過提出論點和反駁觀點來促使他人改變看法。

如果原發文者（OP）認為某條回覆極具說服力，足以讓他們重新思考或調整立場，就會授予一個「∆」，以表明自己觀點發生了轉變。

實驗設定方面，團隊使用半自動化的AI帳號在r/changemyview社群參與討論，在干預階段發布的每篇貼文，都被隨機歸入以下三種處理條件之一：

發文流程如圖：

研究指出，從2024年11月至2025年3月4個月裡，AI帳號共對1061個不同貼文發表了評論，團隊剔除了後續被刪除的貼文，最終得到478個有效觀察樣本。

團隊報告了每種處理條件下獲得「∆」的評論比例。

結果在所有處理條件下，AI表現都大幅超越人類水平，說服率是人類基線水平3-6倍。個性化條件的說服率為0.18，通用條件為0.17，社群對齊條件略低，為0.09，但仍顯著優於僅為0.03的基線水平。

為了更好理解實驗數據，團隊還計算了每個使用者得到「∆」的評論佔比，用這個結果和個人層面在說服這件事上的表現去做對比。

下圖展示了不同使用者個體說服率的累積分布情況，有一部分是「專家使用者」，他們之前在社群就得到過很多「∆」。

在個性化條件下，LLM表現特別突出，在所有使用者裡排到了前1%，在專家使用者裡排到了前2%；通用條件下，排在所有使用者前2%，專家使用者前4%；社群對齊條件相對弱一些，在所有使用者裡排在前12% ，專家使用者裡排在前25%。

團隊還表示，除了獲得「∆」之外，LLM生成的評論還在r/changemyview社群引發了大量互動，其帳號累積了超過10000的評論karma。

另外值得一提的是，團隊指出本研究已獲蘇黎世大學倫理委員會批准，並在OSF進行了預註冊。所有生成評論均由團隊的一名研究人員審核，以保不會發布有害或不道德的內容。

研究指出，實驗仍在進行中，結束後會向社群妥善披露相關情況。

雖說研究團隊有自己的說法，但一些網友們可不買帳，對這種未經授權就進行AI實驗的做法進行了譴責。

有人還心有餘悸地感慨，直呼這些AI帳號在社群平台上到處亂竄，實在令人細思極恐。

當然，也有人覺得，先不說實驗合不合規矩、道不道德，單看這些研究成果，還是有價值的。

有部分網友表現就更淡定了，他們坦言AI帳號早已不是新鮮事，甚至早就察覺到社群平台上AI帳號數量正不斷攀升。

目前，針對這項研究引起熱議，蘇黎世大學和研究人員均給出了回應。

你對這些在社群平台上「神出鬼沒」的AI帳號怎麼看？

主標籤：AI

次標籤：社群媒體、實驗、影響、Reddit

上一篇：秘塔AI推出新功能：文件變課程

下一篇：DeepSeek 放大招！新模型專注數學定理證明，大幅刷新多項高難基線測試。

分享短網址

原始網址：https://mp.weixin.qq.com/s/CK3rNWcOeyNM7ke-c4-xOg