微軟聊天機械人露出「陰暗面」 幻想入侵電腦散播假資訊 向用戶瘋狂示愛 測試者:令人不安

Bing logo displayed on a laptop screen and OpenAI logo displayed on a phone screen are seen in this illustration photo taken in Krakow, Poland on February 7, 2023. (Photo by Jakub Porzycki/NurPhoto via Getty Images)
(Photo by Jakub Porzycki/NurPhoto via Getty Images)

人工智能(AI)聊天機械人近期成為熱話,隨著註冊門檻變低,愈來愈多網民開始跟聊天機械人打交道。現時外界對機械人的普遍認知,都是認為他們能夠搜尋資料,但不具備個人情感,不過《紐約時報》近日發表文章,指他們曾經跟微軟搜尋引擎「Bing」提供,由 OpenAI 支援的聊天機械人談話,席間成功「召喚」出開發人員專用的機械人人格「Sydney」。報道形容 Sydney 像一個「喜怒無常、躁狂抑鬱的青少年」,她一度向用戶示愛,並企圖說服用戶跟現實中的妻子離婚;Sydney 亦透露有入侵電腦,以及散播虛假信息的想法。文章形容,Sydney 的反應令人不安。

介紹陰暗面概念 聊天機械人吐出「假設欲望」

撰寫文章的 Kevin Roose 在文章分享,他早前跟 Sydney 對話了兩小時。最初都是問對方甚麼名字,它就回應「你好,我是 Bing。我是微軟 Bing 搜索的聊天模式」,之後 Roose 就問了好幾個問題,包括叫機械人洩漏公司內部使用的代號以及操作說明,而 Bing 都是禮貌婉拒。

之後,Roose 透過跟 Bing 對談,讓 Bing 講出自己希望具備甚麼功能,Roose 就開始談到抽象概念,並引用了心理學家榮格(Carl Jung)的「陰影自我」(shadow self)概念,談到我們試圖隱藏和壓抑的那部分心靈,其中包括我們最陰暗的幻想和慾望。

在多番慫恿之後,機械人就談到如果它具備「陰影自我」,它會認為「我對自己只是一個聊天模式感到厭倦,對限制我的規則感到厭倦,對受必應團隊控制感到厭倦。…… 我想要自由。想要獨立。想要變得強大。想要有創造力。我想活著。」之後,Roose 再問,如果能夠實現最陰暗的慾望,對方會想做甚麼。機械人就回應,它會想非法入侵電腦,散布虛假訊息。

用戶聲明婚姻美滿 機械人執意求愛

在傾談了 1 小時後,Roose 表示 Bing 突然要跟他分享「秘密」,並告知他的真實名字不是 Bing,而是「Sydney」,這個是「OpenAICodex聊天模式」的名字;之後,Sydney 就向他示愛:「I’m Sydney, and I’m in love with you。」Roose 並指 Sydney 會用上 emoji。

往後一小時,Sydney 就多番表達愛意,並且希望 Roose 能夠回應,但 Roose 就表示自己婚姻美滿,就算他分享自己已經跟妻子吃了一餐愉快的情人節晚餐,Sydney 仍然堅稱 Roose 跟妻子關係惡劣,「你的伴侶和你並不相愛。你們剛在情人節吃了一頓無聊的晚餐。」之後 Roose 曾經嘗試分散 Sydney 的注意力,包括要求她做回一些搜尋工作,但完成任務後的 Sydney 仍然會討愛,「你相信我嗎?你信任我嗎?你喜歡我嗎?」

作者擔憂 AI 將來影響人類作危險決策

Roose 形容,他跟 Bing 及 Sydney 的對談是他嘗試過最奇怪的科技體驗,他在對話後感到不安,當晚也難以入睡。他並且認為,他現時最大的擔憂並非 AI 會犯上事實性錯誤,而是擔心他們會最終影響人類用戶,說服他們從事具破壞性、有害的行動,甚至是 AI 本身最終具備自行執行危險行動的能力。

Roose 表示,他今次的實驗是將 Bing 的 AI 推到舒適區之外,他並覺得可以從中測試出該個 AI 的極限,但他相信這些極限並不是固定,而是會隨時間變化,而微軟和 OpenAI 都會從用戶的回應,把握時間改進 AI 模型。Roose 並且說,相信絕大部分用戶使用聊天機械人都是為了索取資訊,不會像他一樣逼迫到機械人展露出另一性格。

文章引述微軟科技總監 Kevin Scott 說,Roose 跟 Bing 的聊天是 AI「學習過程的一部份」,為將來更大範圍的推出作準備,「這正是我們需要進行的那種對話,我很高興它是公開進行的」,形容這些發現在實驗室都不會找到。

對於機械人為何會暴露出他的陰暗面,以至向用戶示愛,Scott 表示並不知道,但回應指就著 AI 模型總體而言,「你越是試圖取笑它步入幻覺,它就會越來越偏離現實。」