國際中心/綜合報導

▲AI進化到會撒謊,甚至威脅工程師。(示意圖/翻攝自pexels網站)
美國AI新創公司Anthropic近期分享一起內部測試,指出在某次測試中,最新推出的模型「Claude Opus 4」出現失控狀況,因為這款模型為了避免被停止,竟利用工程師過往的網路和視訊紀錄,威脅若強制關閉,就要公開工程師外遇的情形,讓研究人員震驚不已。
根據綜合外媒報導,「Anthropic」最新發布的「Claude Opus 4」,為OpenAI、Google及xAI等AI的競爭對手;然而,在近期的一場封閉測試中,「Claude Opus 4」出現了不受控的情形。因為工程師在某些原因,試圖警告要關閉電源,誰料「Claude Opus 4」,竟然利用該名工程師過往在網上活動紀錄和視訊紀錄,揪出其出軌證據,威脅工程師若拔掉電源,就揭露他對婚姻不忠的行為。
無獨有偶,熱門聊天機器人ChatGPT美國開發商OpenAI的o1,嘗試「把自己下載」至外部伺服器,事後被抓包時,竟還矢口否認。以上種種情況事件,顯示AI可能已進化到為了達成目的,可以對人類撒謊、算計,甚至勒索威脅開發者,而開發者對其內部運作與行為機制,似乎也漸漸無法完全掌控。