「我不是機械人」驗證圖片考起網民 30次失敗放大鏡用埋 背後竟為Google免費打工

近日不少市民登記消費券時,都遇到「我不是機械人」驗證程序,網民大呻圖片難揀,「揀到懷疑人生」,但你可知道,其實你在為訓練AI出一分力嗎?

「我不是機械人」驗證程序,是一個考驗用戶是否真人的測試,每次測試會顯示九格圖片,用戶要按題目要求選出圖中的答案,例如選出所有是巴士的圖片,全答對才能通過測試,以證明用戶是真人。不少網民都大呻難揀,有人表示揀了30次才能完成,亦有人需要靠家人朋友幫忙才能通過驗證,更有人指父母出動放大鏡都玩不到。

這些圖片題目的難度令網民高呼「難過學校考試」,有些題目似乎怎也找不到答案,台灣有網友曾問「越南士兵在哪裡?」,甚至不少網民惡搞圖片,創作出驗證圖片生成器,苦中作樂。

惡搞之餘,大家有沒有細心想過,所有用來驗證你「不是機械人」的圖片都有兩個共通點?一是圖片都是外國的道路為背景,二是題目與道路相關,例如路牌、巴士、十字路口、消防栓、交通燈、斑馬線,甚至門牌號碼。

此外,九格圖片亦大多數是模糊,令人難以分辦答案。

沒錯,就是因為模糊,所以Google才需要你來選擇。

要了解這些令人「懷疑人生」的圖片,首先大家可以回想一下,有沒有做過以下的文字驗證測試。

在這一種驗證測試中,系統要求你閱讀兩組圖片的文字,然後在方格輸入正確答案。

這些圖片,來自一間將印刷版典籍數碼化的公司,紙質的典籍因年代久遠及印刷關係,部份字詞不能靠自電腦掃描辨認得到,於是這公司就想出一條絕世好橋,將驗證條件與辨認文字結合,簡單來說,兩組文字中,有一組是系統已知答案的文字,另一組是系統無法辨認要靠你輸入的文字,當你輸入第一組正確,系統會相信你是真人,然後採納你第二組輸入的文字來存檔,並會反覆由不同用戶再驗證,將正確答案傳到系統資料庫存檔。

這種以圖片換取人手輸入文字的驗證碼,令你免費幫這間公司打工,唯一回報是你可以繼續登入想到訪的網站。聰明的讀者可能會問,如果用戶輸入了錯的答案會不會令系統學習錯誤,系統由2007年面世,10年後已發展到每日有2億用字錄入系統,這亦是AI學習的奧妙之處。

這公司就是Google收購的reCAPTCHA,2012年起,reCAPTCHA加入Google Map街景的門牌號碼,此後發展出一系列令大家「懷疑人生」的圖片。reCAPTCHA提供的道路圖片,就是要你免費為AI作出貢獻,讓AI學習辨認路牌、巴士、十字路口、消防栓等,原理與上文提及的圖片文字相約:答對了你就可以繼續到訪網站,然後系統AI得益,答錯了你就要答到對為止,而且題目會越來越難,以分別你是否為真人。

這種九格圖片在網絡界不受歡迎,大批網民投訴題目過難,而且亦是變相免費幫系統打工,故此reCAPTCHA在2014年推出了進階版,真實用戶只需按下「我不是機械人」的選項就能過關,靠系統分析用戶的鼠標方向軌跡和鍵盤操作,來辨别你是真人。去年更加強了以用戶計分制的方式,來辨認用戶是否真人的功能,減少真實用戶需要進行驗證的機會。不過目前本港申請消費券的驗證程序,則暫時沒有見到此V3進階版的應用。

或許未來有一天,當你見到路上有Google AI無人駛駕車時,你可以停低想一想,你曾經為它的研發出過一分力。