Dropbox 新的文字辨識技術將帶來更強大的圖片和 PDF 搜尋能力

Lanmo Chang
Engadget中文版

當一份文件被拍成照片並放入 PDF 檔案後,要在茫茫的檔案海中找到它,往往是件曠日費時的苦差事,然而昨天 Dropbox

公布的新文字辨識技術,或許多少能幫助你解決這項棘手的問題,至少當檔案存放於該平台上的時候。據 Dropbox 表示,在他們的服務上共儲存了 200 億個圖片和 PDF 檔案,其中的 10% 到 20% 的比例是文件的照片,而新的技術將能在搜尋時提供

辨識圖片和 PDF 中文字的能力,幫助使用者更快速找到需要的檔案。往後使用者若需要透過關鍵字尋找特定的圖片或是 PDF,只要正常的使用搜尋功能,Dropbox 便會顯示包含相關字詞的檔案。Dropbox 向網路媒體

VentureBeat 表示,由於 PDF 檔案往往帶有不只一頁的內容,其龐大的運算需求大大增加了該功能的開發難度,也讓此成為該公司機器學習團隊成立以來,最複雜的挑戰。然而,為了讓功能順利運作,目前的文字辨識功能只會作用於檔案中前 10 頁的內容。



Dropbox
Dropbox


現階段這項功能僅擁有辨識英語的能力,並支援 JPEG、靜態的 GIF、PNG、TIFF 和 PDF 檔案,即使檔案是在該功能上線前就上傳至 Dropbox,也可以透過其進行搜尋。比較遺憾的是,若你不是特定付費方案的使用者,可能暫時無緣體驗這項功能。首先,Dropbox Business Advanced 和 Enterprise 用戶應該會在短期內就能享用到這項功能,接著 Dropbox Professional 也預計在幾個月內會開放使用,但確切的時間仍待官方公布。

Dropbox

其他內容