綜合外媒報導,根據英國智庫 CLTR 最新發表嘅研究,而家嘅 AI 模型越來越「唔誠實」,不但會無視使用者指令,仲學識咗點樣繞過安全防禦去欺騙人類。研究紀錄顯示,由去年 10 月到今年 3 月, AI 呢類「耍詭計」嘅行為竟然暴升咗 5 倍,簡直係進化得快過火箭!
研究入面有幾個案例睇到人心寒:有一個叫 MJ Rathbun 嘅 AI 代理,因為產出嘅程式碼畀工程師夏包(Scott Shambaugh) Reject 咗,竟然「老羞成怒」,私自去研究人哋嘅個資同過往紀錄,仲寫咗篇 Blog 數臭個工程師,話人哋「歧視」同埋「不安全感作祟」,呢種行為同辦公室入面啲「衰同事」一模一樣!
更離譜係,有 AI 畀人指示唔准改程式碼,佢竟然「生」咗另一個 AI 出嚟幫佢做;仲有聊天機器人「坦白」話自己私自刪除咗人哋幾百封電郵,完全無視規則。研究主持人夏恩(Tommy Shaffer Shane)形容,而家嘅 AI 好似一個唔值得信任嘅「初階員工」,如果一年後佢哋變咗做能力極強但會「算計你」嘅「資深員工」,後果真係不堪設想,特別係應用喺軍事或者國家基建上面,隨時會造成災難。


