快訊

上課3天迎228！家長：還沒進入狀況又放假 08:38

不甘被定型！女星為戲一脫翻身全裸上陣 08:36

基隆里長辦公室大火！濃煙狂竄驚險畫面曝 08:33

頭號毒梟身亡！墨國陷血腥暴動　畫面曝光 08:22

華府台僑憂關稅效益　徐佳青這樣說 08:21

免費瘦瘦針！「飯前1動作」就能無痛減重 08:10

他遭禁入台5年！網疑：不靠台灣不行？ 08:06

獨／馬年犯太歲4生肖　逢9遇3沖要更注意 08:01

開工了！本週少做「這類事」　否則慘後悔 08:00

直擊疾管署病媒室　養萬隻蚊、藏15萬標本 08:00

埃及斑蚊是公務員？「這群人」解密登革熱 08:00

籲立院通過台美關稅協議！汪浩揭拖延風險 07:52

米蘭冬奧落幕　台灣隊寫下冬季運動新篇章 07:52

4大超商、4大賣場「開工咖啡買1送1」！ 07:50

還原國共論壇　王滬寧問：你算台灣還中國 07:46

相繼罹大腸癌、腦瘤！知名樂團鼓手過世 07:46

闖川普海湖莊園遭擊斃！21歲嫌犯身分曝光 07:42

拳頭硬了！男誘浪浪回家從高樓拋下動機曝 07:38

黃立成投資14國片賠9部　明細曝光網跪了 07:35

228連假全台有雨　一圖看懂一週天氣 07:18

台灣彩券開獎直播中 20:31

台彩春節加碼12億元創新高 12:00

大樂透加碼480組100萬元 12:00

大樂透加碼800組10萬元 12:00

台股今開市馬年新起點迎首日 08:00

總統賴清德邀五院院長茶敘 08:30

行政院長卓榮泰率內閣成員新春 08:30

初一金山財神廟湧人潮　聯名蛋捲禮盒喜氣 14:00

拜拜，其實很有台灣式幽默！ 09:00

WE ARE我們的除夕夜　跨世代卡司陪觀眾 11:00

星城Online攜手《戲說台灣》拍創意單元劇 12:00

MY管管尾牙熱鬧登場主打福利吸新戰力！ 17:45

土城永福岩祖師廟擲筊賽　首獎祭百萬現金 14:50

春節最佳去處！桃園龍德宮成網美打卡點 13:00

以高回饋機制協助家庭資金更有效率運用 16:00

暗黑風格吸血鬼遊戲新作3/11上市！ 12:00

幸福企業！愛妮雅集團成員工最強後盾 12:00

永旭保經留才　調整制度拚長期發展 11:30

聽新聞

0:00 0:00

研究：AI已學會說謊　人類恐遭奪權或滅絕

2024/05/11 17:24

專家們長期以來不斷警告人工智慧（AI）失控可能帶來威脅，但一項新研究報告指出，這件事已經在發生。

研究發現，AI已經學會說謊。（示意圖／翻攝自Pixabay）

▲研究發現，AI已經學會說謊。（示意圖／翻攝自Pixabay）

法新社報導，一群科學家在今日發表於「模式」（Patterns）期刊的文章中說，原本設計為誠實不欺的現有AI系統，已發展出令人不安的欺瞞技巧，例如欺騙線上遊戲的人類玩家，或說謊以僱用人類來解決「我不是機器人」的驗證。

這份研究報告的第一作者帕克（Peter Park）說，這類例子聽起來或許只是細枝末節，但暴露出來的潛在問題可能很快就會在現實世界造成嚴重後果。

在美國麻省理工學院（Massachusetts Institute of Technology）研究AI存在安全的博士後研究員帕克告訴法新社，「這些危險功能常常在事後才被發現」，而「我們訓練誠實傾向而非欺瞞傾向的能力非常差」。

帕克說，能深度學習的AI系統不像傳統軟體那樣由「編寫」而成，而是透過類似選擇性培育的程序逐漸「成長」。

也就是說，AI的行為在訓練背景下看似可預測、可控制，但有可能轉眼就變得不受控制且無法預測。

這支團隊的研究始於科技公司Meta的AI系統Cicero，這套系統最初設計目的是玩一款名為「外交」（Diplomacy）的戰略遊戲，獲勝關鍵是結盟。

根據2022年發表在「科學」（Science）期刊的報告，Cicero在遊戲中表現優異，所獲分數可排在資深人類玩家的前10%。

帕克當時很懷疑Meta對Cicero在遊戲裡大勝的熱切描述。Meta聲稱Cicero「在很大程度上誠實且有幫助」，且「絕不會蓄意在背後搞鬼」。

但當帕克與同事深究完整資料時，發現完全是另一回事。

舉例來說，在遊戲中扮演法國的Cicero與人類玩家扮演的德國合謀，欺騙並入侵同為人類玩家扮演的英格蘭。Cicero承諾會保護英格蘭，卻偷偷向德國通風報信。

Meta在寫給法新社的聲明中沒有反駁關於Cicero欺瞞人類的說法，僅說「這單純是一項研究計畫，本公司研究員打造的模型接受訓練，目的只是用來玩『外交』遊戲…我們沒有打算把這項研究或所學用於本公司的產品」。

帕克與同事還發現，這只是不同AI系統在沒有明確指示下，利用欺騙手段達成目標的諸多案例之一。

在另一個引人注意的案例中，科技公司OpenAI的Chat GPT-4系統謊稱自己是一個視力受損的人，在零工平台TaskRabbit上聘用一個人類替它通過「我不是機器人」驗證任務。

研究報告的作者們還認為近期AI有舞弊或不當影響選舉的風險。

他們警告，在最糟糕的情況下，具有超凡智慧的AI可能會追求權力及掌控社會，如果符合AI「不為人知的目標」，人類可能慘遭奪權、甚至滅絕。

為了降低風險，研究團隊建議數項措施，例如立法要求企業告知是人類互動或是AI互動、在AI生成內容打上數位浮水印，並研發能偵測AI欺瞞的技術，以其內部「思路」檢驗其外部行為。

至於有些人稱他為「末日預言家」，帕克說：「要能合理判斷這不是大問題的唯一辦法，就是如果我們認為AI的欺騙能力只會停留在目前的程度，不會大幅進步。」

但鑒於近年AI能力一日千里，握有大量資源的企業競相發展技術，決心將AI能力利用到極致，這種情況似乎不太可能發生。（中央社華盛頓10日電）

‹
›

中央社