不論好壞,AI 將改寫我們的搜尋方式

平地一聲雷,聊天機器人的新時代要來臨了!OpenAI 去年 11 月公開 ChatGPT 這種能惟妙惟肖模仿人類書寫的先進大型語言模型 (LLM),完全沒料到它竟成為史上用戶成長最快速的應用程式,短短三個月內註冊用戶數破億,它的成功部分可歸因於 Microsoft 多年來對 OpenAI 挹注百億美金。ChatGPT 以這樣的姿態橫空出世,競爭對手措手不及,驚起 Google百度阿里巴巴爭相投入。然而,隨著加強式搜尋引擎進入戰國時代,人們搜尋的方式與理由勢必會改變。

「我對這項技術充滿熱忱。我們深耕 NLP 技術好多年了,每年都能看到它持續成長。」美國加大爾灣分校資訊科學系副教 Sameer Singh 博士向 Engadget 表示,「人們以為這套技術一夕誕生,其實從萌芽到成熟,經過許多年的醞釀。很高興親眼看到它廣為普及,讓人人有機會可使用。」

近來大型語言模型引起大眾熱烈迴響,Singh 表示:「我認為部分歸因於技術已經成熟,模型的輸出內容上得了檯面,而且大多表現不俗。」Singh 繼續說:「我認為這樣已經夠好了。」

Microsoft Bing search engine in pictured on a monitor in the Bing Experience Lounge during an event introducing a new AI-powered Microsoft Bing and Edge at Microsoft in Redmond, Washington on February 7, 2023. - Microsoft's long-struggling Bing search engine will integrate the powerful capabilities of language-based artificial intelligence, CEO Satya Nadella said, declaring what he called a new era for online search. (Photo by Jason Redmond / AFP) (Photo by JASON REDMOND/AFP via Getty Images)

「我認為這樣的反應這跟技術本身關係不大,而是社會大眾的看法。」他繼續表示,「就算問世的不是 GPT⋯⋯只要有這樣的技術出現並引起廣大迴響,眾人自然趨之若鶩。」

人工智慧技術強化的網路搜尋引擎該如何運作,搜尋引擎公司對此懷抱了各種理想與抱負,決心把握機會「打破常規,快速行動」。Microsoft 期待 Bing AI 能成為你我上網時隨侍在側的「副駕」,伴隨瀏覽回答各種問題,甚至為社群網路貼文代筆。

這將徹底扭轉我們目前使用搜尋引擎的方式。目前,根據問題的複雜度,使用者可能需要四處尋訪網站,從去蕪存菁的過程中理出一個概念,然後再加以評估。

「如果有一個模型可以預讀各個頁面,把四處蒐羅來的資訊梳理成目前網頁上不存在的概念,那可以省下獲得資訊的許多前置工作。」美國紐約大學坦登工程學院資工系助理教授 Brendan Dolan-Gavitt 向 Engadget 表示:「資訊都還在,仍然是可以回頭驗證的,也希望這些資訊是正確的,不過這種應用形式目前技術上還沒能全部到位。」

Google 理想中的 AI 技術是讓使用者留在搜尋頁面上,而不是點進目的地頁面。系統會從網路上汲取使用者查詢內容相關的資訊,經由語言模型整併後以答案的方式轉述出來,輔以備註顯示原始網站的參考資訊。

這些都聽起來很棒,也都發展順利,直到最近出了一件挺誇張的事。Google 推出了 Bard 與 ChatGPT 對尬,結果 Bard 在問世後不到 24 個小時內,就在 Twitter 首推廣告中誇誇其談,宣稱「韋伯太空望遠鏡拍下第一張咱們太陽系以外的行星照片。」真是令人錯愕,因為事實上韋伯太空望遠鏡並非史上第一個發現系外行星的裝置,正確答案是 2004 年的歐洲南方天文台的甚大望遠鏡。這一切都是 Bard 從數位虛擬空間憑空杜撰而出。

當然,這不是頭一回機器唬爛。從 Lycos 與 Altavista 問世的那一刻起,搜尋向來就是不斷碰運氣的過程。「搜尋技術問世時,我們覺得儘管它還不夠完美,但已經夠好了。」Singh 回憶:「畢竟我們可以找到各式各樣的答案,而且隨著搜尋技術不斷演進,搜尋表現越來越好。我們使用搜尋引擎,我們也知道什麼時機可以信賴搜尋結果,什麼時候需要翻到搜尋結果的第二頁。」

後來問世的語音 AI 助理,在發展期間所經歷的問題,與先前的文字型 AI 相同。「Siri、Google Assistant、Alexa 等類似的服務推出時,與當初提供給我們的語音助理已經大不相同。」

今天,像 Bard 與 ChatGPT 等大型語言模型,也很可能藉由公開使用,並透過更專業化的醫藥、商業分析與法律等特定技術型與知識型功能,循著相似的過程逐漸提升表現。對此,Singh 指出:「我認為專業化的應用一定會改善它。我不認為像 Google 與 Microsoft會讓這些產品過於專業化,畢竟這樣的公司面對的是普羅大眾。」

從許多方面來看,為了解決如今網路使用者遭遇的各種挑戰,Google 與 Bing 提供的解方其實很合理:做為使用者進入廣大網路世界之前的「中介站」,就這一點,其實就像 90 年代 AOL 提供的 American Online 服務。

REDMOND, WA. - FEBRUARY 7: Washington Post reporter Geoff Fowler asks a Microsoft spokesperson questions about the new, AI-powered Bing search during a demo at the Microsoft headquarters in Redmond, Wash., on Tuesday, Feb. 7, 2023. (Photo by Jovelle Tamayo/ forThe Washington Post via Getty Images)
REDMOND, WA. - FEBRUARY 7: Washington Post reporter Geoff Fowler asks a Microsoft spokesperson questions about the new, AI-powered Bing search during a demo at the Microsoft headquarters in Redmond, Wash., on Tuesday, Feb. 7, 2023. (Photo by Jovelle Tamayo/ forThe Washington Post via Getty Images)

Singh 解釋說:「搜尋從來就不是目的,而是過程。人們找資訊是有理由的。把搜尋當作是『尋覓資訊完成工作』,跳脫字面意義上的『搜尋』,不難想見能「消化」搜尋結果的工具會有多實用。」

對於各項功能集於一身的人工智慧技術,Singh 認為「確實令人憂心。直接了當地說,有了這些聊天功能,人們大概就更不會前往這些訊息所在的網站上了。」

聊天機器人慣於最後出現過度聰明的跳躍式結論,這已經夠糟糕了,但這種做法還可能會「無形中鼓勵使用者不上網站查核、不閱讀完整資訊來源,只全盤接受聊天介面提供的版本,然後變得越來越依賴聊天機器人」Singh 如此警告。

對此,Singh 與 Dolan-Gavitt 都深有同感。「如果掠奪了網站本應獲得的造訪量,利用網站的資訊卻又不為它導流,那麼這些網站也就沒有理由繼續提供新內容。」Dolan-Gavitt 向 Engadget 表示,「另一方面,點擊難免會引來垃圾訊息,造成搜尋越來越難用。我認為這種搜尋的缺點可能就是大眾對聊天機器人趨之若鶩的原因。」

這樣的需求,再加上衍生出的全新市場,讓業界龍頭們都開始爭相推出自己的新產品,且不論是否已準備好,也不管是否會令人驚豔。對消費者來說,廠商爭食此一市場大餅絕非好事。Microsoft 當初在 2014 年初次推出 AI 聊天機器人 Tay,結果慘澹收場 (絕無誇大)。時至今日,Reddit使用者已能繞過 OpenAI 的限制,讓系統寫出種族歧視內容。隨著大型語言模型獲得廣泛使用,這只是其中兩個看似更為無害的挑戰,但依然難以克服,因為這需要產業內競爭對手廠商攜手合作。

「我比較擔憂的是,在軟體端,這是否會讓更多人有能力創造出惡意軟體與病毒。」Dolan-Gavitt 表示。「雖然不至於極端到產出誤導資訊,但絕對更容易讓人製造出垃圾訊息。」

「目前為止,與安全性相關的許多想法都是基於以下前提:幾家核心公司同意坐下來談,建立某種程度上的安全性標準。」Dolan-Gavitt 繼續表示,「我認為競爭越激烈,人們就越有可能進入開放式的環境,下載不受限制的模型,安裝到自己的伺服器上,產生想要的各種內容。那些依賴於集中模型的做法會逐漸開始瓦解。」

原文:How AI will change the way we search, for better or worse, by Andrew Tarantola