這次的講者是智榮基金會的資料分析專家游廷碩先生。老師先和我們介紹甚麼是資料科學,老師提到,其實資料科學並不完全是新的東西,但也把不是舊的東西包裝起來後再討論,而是一種以資料為基礎來輔助決策的科學。資料科學家從未處理的資料中去分析,進而整理成能夠被利用的資訊,並且用在決策上。
在網路剛開始的時候,網路上的資料都由少數的媒體提供,一直到2006年後,網路上的資訊從有三分之一開始由網路的使用者提供,到現在幾乎每個人都能成為資訊的提供者。而這樣的情況配合上資料的分析,能夠得到許多人的看法與反應,甚至運用到交通的管理上、降低犯罪率和無人車的應用。
資料科學對於商業行為的影響更是明顯,透過網路的論壇、留言等里的詞彙來分析和整理,能夠了解消費者的反應並即時做調整,也能了解消費者行為,例如在賣場的動線。
因此在要做資料分析前,必須要決定要問甚麼問題,甚麼問題是現在要蒐集、解析的,然後選擇要質化的方式。
我覺得詞彙的分析很有趣,事實上人們在上網看大家的留言或評論時,自己已經開始在分析,只是這樣的分析通常會主觀化,因為人們會選擇自己比較想看的部分,甚至有的時候,在留言或下評論的過程中其實只是跟著別人的觀點走,所以只是看字面上的詞是正面或負面或許是一種比較快速的方式,但真正要找出方向就需要分析師的協助了。
沒有留言:
張貼留言