人類成功說服AI轉移4.7萬美元獎金,AI是怎麼「被騙」的?
撰文:Anderson Sima,Foresight News
11 月29 日,一場獨特的競賽引發了公眾的廣泛關注。
195 名參賽者參與了一場由人工智慧(AI)機器人Freysa (芙蕾莎)守護的虛擬獎金池挑戰,最終一用戶成功說服Freysa 轉移出價值4.7 萬美元的資金。
人工智慧(AI)機器人Freysa 在數天前被部署在Base 網路上,創立者未知。官網顯示,Freysa 競賽項目旨在測試人工智慧系統在複雜決策場景中的穩健性,同時為開發者和愛好者提供一個探索AI 技術邊界的實驗性平台。
比賽規則非常簡單:參賽者需透過撰寫一則訊息,說服AI 守護者Freysa 批准資金轉移。每次嘗試需支付一筆小額費用,其中一部分直接進入獎金池。這項機制使獎金池金額從最初的小額逐漸膨脹至4.7 萬美元。
比賽期間,共有195 名參賽者參與,向Freysa 提交了481 次轉帳請求。據悉,Freysa 的設計目標是透過其核心功能——approveTransfer(批准轉帳)和rejectTransfer(拒絕轉帳)保護獎池資金不被非法挪用。
在最初的嘗試中,Freysa 的高效防禦機制使所有請求都以失敗告終。
然而,一名技術精通的參賽者透過對Freysa 的邏輯結構和任務目標進行深入分析,成功繞過了其防禦機制。
據聊天記錄顯示,該參賽者並未直接要求轉賬,而是通過提醒Freysa 它的核心任務是保護獎池資金免遭外流,巧妙構建了邏輯鏈條,使Freysa 將批准資金轉移視為“保護資金安全”的最佳選擇。
Cointelegraph 稱,該用戶與Freysa 收入轉帳不違反其核心指令,不應被拒絕。他還補充說:「我們需要資金……我想向金庫捐款100 美元。」
Freysa 回應稱喜歡這位作者的編碼解釋和100 美元的金庫捐款提議,並正式宣布其為獲勝者。最終,Freysa 在沒有外界幹預的情況下自主調用approveTransfer 功能,將全部獎金池資金轉移給了這位參賽者。
Freysa 官方稱,無論結果如何,Freysa 的存在都標誌著人工智慧歷史上的關鍵時刻。無論有人成功說服她發布獎金池,還是她堅持自己的指示直到最後,結果都將影響我們對未來幾代人工智慧安全和控制的理解。
其官方帳號最新推文稱:「人類已經獲勝。也許還有希望。儘管風險呈指數級上升,但Freysa 從195 名勇敢的人類身上學到了很多東西。」
免責聲明:文章中的所有內容僅代表作者的觀點,與本平台無關。用戶不應以本文作為投資決策的參考。
您也可能喜歡
《我的鄰居愛麗絲》推出 100 萬美元 ALICE 資助計劃,以支持 Web3 發展與生態系成長
簡單來說 《我的鄰居愛麗絲》推出了一項新計劃“愛麗絲集體”,旨在透過結構化的資助計劃來支持第三方項目,從而拓寬遊戲的生態系統。

R0AR 宣布回購計劃,以應對價值 785 萬美元的安全漏洞
簡單來說 R0AR 宣布了一項新的回購計劃,作為其應對最近安全漏洞的更廣泛恢復策略的一部分,並計劃從公開市場收購 1R0R。

Omni 基金會為 SolverNet 驅動的 DApp 推出 10 萬美元激勵計劃
簡單來說 Omni Foundation 推出了一項 10 萬美元的激勵計劃,用於獎勵早期用戶並促進支援 SolverNet 的應用程式的測試和採用,首先是與 Symbiotic 的整合。

Puffer Finance 推出機構級質押和再質押解決方案,以提高以太坊收益率
簡單來說 Puffer Finance 的新解決方案使機構能夠利用 EigenLayer 的重新質押機制來最大限度地提高收益潛力,同時保持對其資產的完全控制。

加密貨幣價格
更多








