數據、謊言與真相 512Please respect copyright.PENANAMVyquWzprb
我會選擇這本書的原因是曾經參加過兩次BigData的營隊,對這方面有些許興趣,而且在這個資訊爆炸、科技進步的時代,若跟不上世界的演變,將會失去許多開闊眼界甚至未來的工作機會,不如藉此機會來看看大數據在科技界引起了什麼新風波吧!
作者在書中介紹了許多由大數據做出的種研究,小至馬匹、大至國家,甚至全世界,這就是大數據的魅力!從傳統中的文本子集,跟著時代的進化成了電子化的資料庫,資料大到可以完成曾經無法進行的研究,大數據可以使研究人員放大搜索細密的變數,也因為樣本夠多而提供出更可靠的實驗解果推翻過往錯誤的想法。
書中最有趣的地方無非是作者不斷的提出問題,然後一步步帶我們到大數據的世界,告訴我們進行分析的過程,當中有錯誤、有意外的發現,也結論出人們的直覺不一定都是正確的。
本身對動物很感興趣,書中也有一項實驗跟動物有關,「成為賽馬明星的關鍵是什麼?」,這個問題非常吸引我,所以是我最喜歡也印象最深刻的一段,這部分引出了舊思想與新科學的抗衡,當中也有許多波折才造就出一位現代專業的馬匹經紀人。 最終作者也在這章節指出有趣的結論,「如果你的目標是預測未來,那麼你不太需要擔心你的模型為何奏效」,從文中的內容思考,我認為這就是數據科學家的工作,只要能夠達成目標就好的想法,不需要多加解釋或執著於其中的原因。
後來作者也教導我們一些分析方法,A/B測試法、尋找分身等......,讓大家深入了解大數據分析的歷程,我覺得這部分不只可以在數據分析上有所影響,這部分的知識也可以更廣泛運用在商業、政治、經濟等...更多領域,可以說是獲益良多啊!
除了賽馬明星,大數據也瀰漫在我們的生活之中,而現在的人民大多停留在網路之上,而目前最大的瀏覽器就是Google啦!
書中的資料也大部分來自Google的資料集,而資料集的內容是什麼呢?就是我們平常輸入搜尋欄的資訊!所以這代表我們每天所輸入的問題都一一被記錄下來,而從全世界收集下來的搜尋內容裡隱藏了什麼秘密呢?那就請你自己去探索啦!
既然大數據可以對解決許多問題,但如果涉及到個人隱私呢?我認為這就是當代該思考的問題,政府會不會為了治安問題而監視著我們在網路上的一舉一動?想一想實在是駭人。
之前在營隊是由老師慢慢介紹大數據分析使用的應用程式,並且分組進行資料分析、製作簡報與其他組分享結果,其實一開始的介紹有點枯燥、無聊,而實作方面也很燒腦,導致體驗方面不是很愉快,但這本書讓人身歷其境般與作者一起揭發生活中種種謊言與令人驚奇的真相!
(其實是暑假作業,不知道能不能投稿呢?xD)
ns 15.158.61.5da2