這次邀請到智榮基金會的游庭碩老師,與前次講者介紹到的大數據分析,游庭碩老師這次告訴我們較實務的做法與分析的過程。
資料科學(Data Science Process) 是透過儲存、分析、呈現資料來協助決策的科學,資料儲存又有區分為小資料、中資料、大資料,小資料如個人USB、中資料到雲端、NAS,大資料偏向分散式儲存、Hadoop等等,但是當資料量越大越普遍被儲存在雲端時,安全性就成為一項風險,因為沒有人知道大家的雲端資料會不會某一天被駭客竊取,另外檔案不能不見也不能被不該看的人看到,雖說雲端工具有隱私保證,但還是會讓人感到不安。
大數據資料好處是可以透過資料分析,將原先的資料(如聲音影像數字)進一步歸納成資訊(如圖表),最後從資訊中歸納出知識(如協助決策用的方案),輔助我們解決工作、研究或課業上的問題與決策,依據知識制定策略、執行策略並評估執行成果或修正知識,透過雲端計算(Cloud Computing)儲存、同步、文書處理(如共編)、雲端監控(如父母可以遠端看小孩子在幹嘛),如google的無人駕駛車透過雲端資料,計算附近交通並做出路線規劃、物聯網的裝置連線也是透過雲端計算與資料分析達成各種方便的功能,如醫療人員可以以手機監控床位,針對不同病人給予個人化的醫療、預測股票、商業消費者行為分析(如大賣場中計算哪裡最多人經過幫助銷售商品的設置)、營運流程(如還原財務報表)、財務會計分析、防災中心的氣象文字資料分析、社群文字分析做輿情監控(如知道某公司的各種時期中”正向詞”多少可幫助強化該公司的特色)都是運用資料科學的有趣例子。
演講最後,老師提到雖然資料科學可以幫助人類生或更便利,但在使用這項工具時,需要真正理解我們想知道的問題。也就是說資料分決策結果的好壞是基於研究員對問題的瞭解,能洞見需求點,才能使工具達到最好的效果。

沒有留言:
張貼留言