Google中文語音搜尋補遺和二段影片展示關於 Google 中文語音搜尋,我們得到更多的資訊,包括:

  • 中文語音搜尋不等同於自然語言語音辨識,原因在於語音搜尋只需要辨識一組或幾組關鍵字,並不需要面對人類語言文法的問題,所以較容易達成,辨識度也相對高。

  • 先前提到可以中英文混合辨識,嚴格來說是不行的,因為中文和英文的辨識引擎有些許不同。但更大的原因在於,華人說英文和自然英文在辨識並不相同,所以目前的作法將一些華人常用的英文加入中文語音辨識的辨識庫當中。

  • 語音搜尋的準確度關鍵除了只需辨識關鍵字以外,更重要的原因在於使用雲端運算。簡單來說,過去單機的運算能力不足做到大量資料比對和運算的工作,但透過雲端則能完成。然而Google技術的難度在於如何在這一瞬間把錄音、封包資料送到運端、運算辨識、再封包送回行動裝置上這些動作做完。

  • 關鍵字辨識中,最不容易做到的地方在於數字辨識,因為平平一個「135」,可能就有「一百三十五」、「一三五」或更多種數字的講法。另一方面,同音多義也是語音辨識的難處所在,例如「旗艦」和「歧見」。Google有一種特別的克服方式,就是用過去人們搜尋的資料量來判讀。跳轉再看兩段「地點語音搜尋」和「地址語音搜尋影片」:
地點語音搜尋:台北101

地址語音搜尋:台北市中山南路21號