哈?AI秘密潛入Reddit社群,「操縱」用戶觀點4個月。
離譜的是,人類全程毫無察覺,而且被AI說服改變想法的機率,高達正常基準的6倍!
Reddit Lies在X上發布了一則貼文,引發二百多萬網友圍觀。
事情經過是這樣的。
Reddit的r/changemyview(CMV)版主最近曝光了一項研究,稱蘇黎世大學研究人員在2024年11月至2025年3月期間,瞞著CMV社群用戶,搞了一場未經授權的實驗。
他們違背CMV社群規則,部署了AI帳號生成評論以研究AI如何影響和改變人們的觀點。
Reddit Lies在伺服器上查詢了CMV版主曝光的13個實驗用的機器人使用者名稱,發現僅在幾個月的時間裡,這些機器人就發布了近1500條評論。
超100位Reddit用戶給這些AI帳號授予了“∆”,這表明AI生成的論點成功改變了他們的觀點,是基線水平的6倍。
關鍵是,Reddit Lies還表示有的AI會直接向用戶撒謊,散播虛假資訊……
且根據團隊發布的研究,在實驗期間,r/changemyview社群的網友完全沒察覺到那些評論竟然是AI帳號發出來的。
消息一出,瞬間炸鍋。馬斯克也「天吶」一聲冒了個泡。
先來看一下這項實驗。
研究在Reddit平台上的r/changemyview社群進行,該社群擁有近400萬用戶,按規模位列Reddit子版塊前1%。
在r/changemyview中,用戶就各類話題分享觀點,透過提出論點和反駁觀點來促使他人改變看法。
如果原發文者(OP)認為某條回覆極具說服力,足以讓他們重新思考或調整立場,就會授予一個「∆」,以表明自己觀點發生了轉變。
實驗設定方面,團隊使用半自動化的AI帳號在r/changemyview社群參與討論,在干預階段發布的每篇貼文,都被隨機歸入以下三種處理條件之一:
發文流程如圖:
研究指出,從2024年11月至2025年3月4個月裡,AI帳號共對1061個不同貼文發表了評論,團隊剔除了後續被刪除的貼文,最終得到478個有效觀察樣本。
團隊報告了每種處理條件下獲得「∆」的評論比例。
結果在所有處理條件下,AI表現都大幅超越人類水平,說服率是人類基線水平3-6倍。個性化條件的說服率為0.18,通用條件為0.17,社群對齊條件略低,為0.09,但仍顯著優於僅為0.03的基線水平。
為了更好理解實驗數據,團隊還計算了每個使用者得到「∆」的評論佔比,用這個結果和個人層面在說服這件事上的表現去做對比。
下圖展示了不同使用者個體說服率的累積分布情況,有一部分是「專家使用者」,他們之前在社群就得到過很多「∆」。
在個性化條件下,LLM表現特別突出,在所有使用者裡排到了前1%,在專家使用者裡排到了前2%;通用條件下,排在所有使用者前2%,專家使用者前4%;社群對齊條件相對弱一些,在所有使用者裡排在前12% ,專家使用者裡排在前25%。
團隊還表示,除了獲得「∆」之外,LLM生成的評論還在r/changemyview社群引發了大量互動,其帳號累積了超過10000的評論karma。
另外值得一提的是,團隊指出本研究已獲蘇黎世大學倫理委員會批准,並在OSF進行了預註冊。所有生成評論均由團隊的一名研究人員審核,以保不會發布有害或不道德的內容。
研究指出,實驗仍在進行中,結束後會向社群妥善披露相關情況。
雖說研究團隊有自己的說法,但一些網友們可不買帳,對這種未經授權就進行AI實驗的做法進行了譴責。
有人還心有餘悸地感慨,直呼這些AI帳號在社群平台上到處亂竄,實在令人細思極恐。
當然,也有人覺得,先不說實驗合不合規矩、道不道德,單看這些研究成果,還是有價值的。
有部分網友表現就更淡定了,他們坦言AI帳號早已不是新鮮事,甚至早就察覺到社群平台上AI帳號數量正不斷攀升。
目前,針對這項研究引起熱議,蘇黎世大學和研究人員均給出了回應。
你對這些在社群平台上「神出鬼沒」的AI帳號怎麼看?