2016年3月22日 星期二

游庭碩老師 / M10210105

這次的演講者為智榮基金會研究員游庭碩先生,演講主題為巨量資料分析與應用。游庭碩先生秉持著理性的科學精神,從資料科學的定義開始切入,進而帶入他的實際案例而貫穿整場演場,十分精彩。

其中有提到一個金字塔狀的圖表,最下面是「原始資料」,是直接由使用者中收集過來的原始資料,有各式各樣的形式;中層是「資訊」,是由原始資料歸納、收斂過後的圖表資訊;而最上層是「智慧」,是經由反覆思考資訊而粹煉出來的可貴洞見(insight)。然而這整個金字塔的進程就是人類對於智慧的外部化(externalize)的一個表現,也是大數據應用的核心目的。再來提到過去Web 2.0的時代,這個是非常重要的轉變。因為資料由媒體提供開始轉變成資料由使用者提供,結束了資訊不對等的時代,將資訊的主導權還回使用者。所以使用者開始可以利用網路來搜尋資料,淘汰那些不願意公佈資訊的資本霸權,造就了現今蓬勃發展的網路型態。

當然,游庭碩先生分享的案例都是巨量資料為我們生活帶來的好處,其中的龍吟論壇對於消費者需求的文本分析讓我非常佩服,巨量資料的應用真的非常廣泛。但他也不諱言地提到巨量資料有侵犯個人隱私的隱憂,這就讓我想起批判性設計(Critical Design)始祖Anthony Dunne & Fiona Raby也曾經對相似議題提出一個有趣的批判性設計 - Spymaker (如下圖)。大意就是可以讓狗戴上這個頭套,讓牠偵測電波並帶你到一個沒有被監控的地方,甚是有趣。


最後資料科學的定義:「透過儲存、分析、呈現來協助我們決策」。我認為協助這兩個字非常重要。任何東西必定有其極限,我們切勿讓這些資訊過份地引導我們的決策。就如同輿情分析,資料量愈少,誤差就愈大。而且他是利用關鍵字來判斷情緒,可是人類語言有反諷、幽默、比喻等等高階語言的抽象概念,那究竟能分析到何種程度?究竟可以多準確?這值得我們去深思。

沒有留言:

張貼留言