大數據應用層面廣 理大學者:可訂造藥物

星島日報
理大電子計算學系副教授盧至力(左)與鍾富禮(右),有份參與校內有關大數據軟件開發及分析的研究。現時理大有至少五至六項大數據相關的研究項目,上圖為大學伺服器。
理大電子計算學系副教授盧至力(左)與鍾富禮(右),有份參與校內有關大數據軟件開發及分析的研究。現時理大有至少五至六項大數據相關的研究項目,上圖為大學伺服器。

(綜合報道)(星島日報報道)近年社交網站、網絡購物、搜尋器等已成為市民生活的一部分,自千禧年後,全球踏入了劃時代的大數據年代。要處理海量數據,開發軟件成為當代計算機科學學者面對的重要課題。理工大學電子計算學系學者表示,大數據的應用已由金融業擴展至其他行業如醫學,例如為研發新藥物進行數據分析,或將病人資料數據進行分析,一旦成功將能為病人度身訂造藥物,對醫學界是重要的突破。

大數據(Big Data)又被稱為海量資料或巨量資料,意思是指大量(Volume)、高速(Velocity)和多變(Variety),在千禧年時由搜尋器Google始出現。早期應用大數據的行業以金融業為主,但近年智能手機和其他流動裝置普及,大數據應用變得隨處可見,如社交網站facebook會在用戶按下專頁後,自動顯示其他推介專頁;網購平台淘寶會在買家購物後,瞬間列出其感興趣的商品,甚至連暑假期間舉行的世界盃,德國隊奪冠的其中一個功臣就是大數據。

理大電子計算學系教授陳振接受本報專訪表示,大數據的應用多樣化,十年前已開始進行名為「面向新藥研發的生物大數據分析」的研究,最初研究不同藥物之間的成分相同的地方,但過程中提升至了解更多藥物和疾病的關係,如不同藥物對不同人會否產生相同的副作用及治療成效。

他表示,人類的基因蛋白和DNA數目眾多,而目前的西醫藥未有像中醫藥般,在相同的疾病下因應不同人的體質而配置不同的藥物,「人體內的DNA和藥物內的化學分子,是兩個非常大的數據庫,需要利用電腦進行大數據分析。」由於電腦的速度愈來愈快,加上取得數據的容易度大增,陳振展望,大數據在醫學上的利用將成大趨勢。

從事大數據分析的理大電子計算學系副教授鍾富禮亦指,大數據在未來有很大的發展空間和潛力,如影像分析和醫學研究,但坦言兩者都在起步的階段,預計過程非易事,「影像分析不單指人臉檢測,還包括追蹤該人的位置,比實質現有的數據分析更難。」他又形容,大數據是應用為本的科技,相信大數據日後能在醫學上作出貢獻,「以香港為例,醫院管理局儲存了大量病人資料,但未有做過分析方面的研究。若果日後能善用資料庫內的數據並加以分析,有望為病人度身訂造所需的藥物。」

不過,要處理大量即時數據,除了在硬件上如伺服器的的配合外,開發相應的軟件尤為關鍵,而與大數據分析的軟件五花八門,因應不同的用途衍生出不同的工具如著名程式軟體SAS。理大電子計算學系副教授盧至力表示,理大目前有五至六個研究項目與大數據有關,「其中一個研究方向是設計大數據工具,以及如何確保數據在一旦停電的情況下不會遺失。」他又認為,最大的挑戰是如何做到最好的資源分配,即是盡量利用電腦硬件內所有的空間和效能。

大數據標誌科技踏入新年代,成為各行各業爭相重點投放開發資源的工具,但同時由於涉及大量數據,尤其是用戶的個人資料,加密和私隱問題引人關注。鍾富禮表示,大數據看似為生活帶來不少便利之處,但背後存在隱憂,「最大的問題源於數據本身,包括其可信性和準確度,假若數據的質素不好,做不到任何準確的預測。」

此外,在大數據時代,每個人在不知不覺中被蒐集,包括在社交網站內的個人相片和讚好專頁、網購平台的購物記錄,故提升大數據處理的保安加密工作將成為未來研究的另一重點。

其他內容