此次演講者為智榮基金會的研究員游庭碩先生,講授的內容是巨量資料分析與應用。
一開始先解釋了什麼是「資料科學(Data Science)」,資料科學主要可以歸類為:儲存、分析、展示、協助決策,簡單來說就是以資料做為決策基礎的一種做事方法,比起過去強調透過經驗去分析,資料科學有資料作為基礎更有跡可循,其相關操作應用除了電腦程式技術外,還必須結合數學、統計學、專業領域所需的知識,可以說是跨領域的結合的一種工具。
而談到大數據的應用,Big data 主要可以分為3V,(1)volume:資料量越來越大 (2)velocity:資料產生速度越來越快 (3)variety:資料種類越來越多樣。這3個v解釋了big data的來源,因為跟過去相比,現在的資料量大且產生速度快多樣性也提高,所以我們需要有跟過去不一樣的技術來儲存、分析資料。在講者分享的應用案例中,看到了google無人車計劃;以及在醫療上的應用,醫護人員可以隨時隨地追蹤不同病患的恢復狀況,給予不一樣的建議,發展成個人化的醫療。另外,還有一個工具是輿情監控,透過文字分析可以得知文章整體情緒是正面還是負面,利用正向詞個數減去負向詞的個數得以判斷,實際運用在廣告的範圍比較多,廠商可以透過輿情監控不斷調整下一次廣告的內容。
最後講者也提到了資料科學在設計方面的應用,除了商業分析的應用外,也可以透過資料來協助設計的決策,以及導入設計思考的概念做資料科學,另外,最重要的是要問對問題,domain knowledge的累積,必須真的進入專業領域的場域才能真正去理解問題,用正確的工具去解決問題。
沒有留言:
張貼留言