最近剛好將大數據DigData這本書讀完,剛好老師也請到真正的資料科學家!!
講者一開始提到資料科學的小、中、大型儲存裝置,類似Hadoop,其中帶到安全性的儲存問題,例如存取安全、隱私安全等等。
這個部份很有趣,也有感而發。從NAS個人是雲端得這個部份來看,我工作得公司也有架設這種伺服器,但初衷是為了公司內部備份的需求,但似乎對我來說變成Work at home的遠端儲存功能。如果,雖然內部資料大多是由我所設計的,但如果今天資料越來越多,牽涉更多NDA的部分,由安全性來看,不就是只能使用內部連網,而不能對外公開。
談到這裡,資料科學分析的方式,講者提到利用資料做出模型,利用模型測試結果,反推修改模型及演算法,就類似設計思考,透過反覆的驗證自己所設計的東西,將產品的可靠度提升。例如,利用我們將unstructure的資料變成可讓機器或電腦讀取的資料,再將資料加入演算法,變成知識,決策者透過知識執行,執行其間蒐集資料,形成一個循環。
實際的例子就如腦震盪使用的APP。醫師透過軟體了解患者的個人狀況,患者所執行的動作再轉換成醫師的資料,反覆循環,形成正向的圈圈。
最後,設計師要如何透過演算法與DigData的方式做設計,這很好玩。因為念設計的學生,就如我,是所有學科目皆不行,更遑論數學。因此,在最後向講者詢問如何依照他們的經驗,學習最初階的C語言與Java。因為我知道,縱使不懂如何完全寫出來,但也有機會能聽懂這方面的知識。
沒有留言:
張貼留言