《大數(shù)據(jù)時(shí)代》讀書筆記
導(dǎo)語(yǔ):生活在信息時(shí)代的我們,讀一讀大數(shù)據(jù)時(shí)代,會(huì)改變一些我們對(duì)這個(gè)世界的看法。
《大數(shù)據(jù)時(shí)代》讀書筆記一
世界的本質(zhì)就是數(shù)據(jù),當(dāng)你掌握了數(shù)據(jù),你便掌控了世界—你可以輕而易舉地通過(guò)數(shù)據(jù)中的相關(guān)關(guān)系預(yù)測(cè)事物的發(fā)展,將一切不利因素扼殺于搖籃之中—這遠(yuǎn)勝于"防患于未然"。
《大數(shù)據(jù)時(shí)代》一書,讓我們?cè)谟^念上有了三大轉(zhuǎn)變:要全體不要抽樣,要效率不要絕對(duì)精確,要相關(guān)不要因果。全書介紹了 "大數(shù)據(jù)"時(shí)代三種大的變革:思維變革,商業(yè)變革和管理變革。在這些巨大變革如洪水一般的"沖擊"之下,現(xiàn)代社會(huì)的運(yùn)作方式必將有重大的改變,若不順應(yīng)這種變革的潮流,就像古中國(guó)固步自封,最終被堅(jiān)船利炮打開國(guó)門而自己還用著長(zhǎng)鉤鐵戟抗?fàn)幰粯,不可避免被掠奪,被落于世界進(jìn)程之后,所以我們必須轉(zhuǎn)變我們的思想。
"我們不再熱衷于尋找因果關(guān)系,而應(yīng)該尋找事物間的相關(guān)關(guān)系",我想這句話是本書的核心思想。大數(shù)據(jù)時(shí)代,信息與數(shù)據(jù)已成為了一切的本源,我們生活在各種數(shù)據(jù)構(gòu)成的海洋之中,如果從另一種視角看,就好像無(wú)數(shù)條"看不見(jiàn)的線"將我們與這些數(shù)據(jù)聯(lián)系到一起,這是我們以前從未有過(guò)、從未想過(guò)的。大數(shù)據(jù)改變了我們以前的通過(guò)因果關(guān)系了解世界的方法,而提供了幾種新的途徑,因?yàn)椋诖髷?shù)據(jù)時(shí)代,我們可以分析更多數(shù)據(jù),有時(shí)甚至可以處理和某個(gè)特別現(xiàn)象相關(guān)的所有數(shù)據(jù),也就是:樣本=總體;而且,當(dāng)研究數(shù)據(jù)如此之多時(shí),我們已不熱衷于"精確",而是"混亂",若不接受"混亂",那么有95%的非結(jié)構(gòu)化數(shù)據(jù)無(wú)法利用,這將無(wú)法使我們構(gòu)建完整的數(shù)據(jù)世界,在分析更多、更全面的數(shù)據(jù)之后,我們就可以從這些數(shù)據(jù)之中發(fā)掘它們的相關(guān)關(guān)系,即以"是什么"而不是"為什么"的角度看待數(shù)據(jù),不用管其從何而來(lái),只要分析其如何影響其他事物既可,即"讓數(shù)據(jù)自己發(fā)聲",這些,徹底推翻了人類以前探索數(shù)據(jù)的方法,展現(xiàn)了一個(gè)全新的世界。
這種觀念以驚人的力量給現(xiàn)知識(shí)狀況帶來(lái)了巨大的沖擊,通過(guò)對(duì)海量數(shù)據(jù)的分析,獲得巨大價(jià)值的產(chǎn)品和服務(wù),或深刻的洞見(jiàn)。比如谷歌公司,2009年H1N1流行之時(shí),通過(guò)檢測(cè)檢索詞條,處理34。5億個(gè)不同的數(shù)據(jù)模型,通過(guò)預(yù)測(cè)并與2007、2008年的美國(guó)疾控中心記錄的實(shí)際流感病例進(jìn)行對(duì)比后,確定了45條檢索詞條組合,并將其用于一個(gè)特定的數(shù)學(xué)模型后,預(yù)測(cè)結(jié)果與官方數(shù)據(jù)相關(guān)系數(shù)高達(dá)97%,這種大數(shù)據(jù)技術(shù),以前所未有的方式,通過(guò)海量數(shù)據(jù)分析得出流感所傳播的范圍,為預(yù)測(cè)流感提供了一種更快速、高效的工具。
同時(shí),雖然大數(shù)據(jù)可為人類造福、對(duì)抗病癥,但這僅限于掌握這門技術(shù)而言,若不重視這種技術(shù),當(dāng)我們的對(duì)手早于我們一步構(gòu)建這種數(shù)據(jù)網(wǎng)絡(luò)之時(shí),便是我們的災(zāi)難,想想,大數(shù)據(jù)雖核心的在于預(yù)測(cè),當(dāng)敵人通過(guò)這種手段預(yù)測(cè)我方下一步的行動(dòng),將是可怕的—比如你的.導(dǎo)彈將從何處發(fā)射,將飛往哪,你的軍隊(duì)動(dòng)向、目標(biāo),總之所有一切"未來(lái)"將掌控于敵手,敵方甚至可以借此發(fā)現(xiàn)那些將來(lái)有"大作為"的人,從而進(jìn)行滲透或扼殺,這對(duì)我們的發(fā)展無(wú)疑是致命的,所以,盡快加速大數(shù)據(jù)系統(tǒng)的構(gòu)建進(jìn)程是必須的。
對(duì)于我們國(guó)防生,也必須順應(yīng)這種發(fā)展趨勢(shì),未來(lái)的時(shí)代必將是數(shù)據(jù)極易獲取,數(shù)據(jù)網(wǎng)絡(luò)共享化的時(shí)代,通過(guò)這些數(shù)據(jù),建立數(shù)據(jù)模型,可以準(zhǔn)確分析并給出適合每一個(gè)人的計(jì)劃,如運(yùn)動(dòng)量、訓(xùn)練強(qiáng)度,可以"先知、先覺(jué)",及時(shí)發(fā)現(xiàn)一個(gè)人的負(fù)面情緒前及時(shí)疏導(dǎo),這些必將成為現(xiàn)實(shí),我們必須跟進(jìn)時(shí)代,做好準(zhǔn)備,去應(yīng)對(duì)大數(shù)據(jù)時(shí)代的一切!
《大數(shù)據(jù)時(shí)代》讀書筆記二
這本書里主要介紹的是大數(shù)據(jù)在現(xiàn)代商業(yè)運(yùn)作上的應(yīng)用,以及它對(duì)現(xiàn)代商業(yè)運(yùn)作的影響。
《大數(shù)據(jù)時(shí)代》這本書的結(jié)構(gòu)框架遵從了學(xué)術(shù)性書籍的普遍方式。也既,從現(xiàn)象入手,繼而通過(guò)對(duì)現(xiàn)象的解剖提出對(duì)這一現(xiàn)象的解釋。然后在通過(guò)解釋在對(duì)未來(lái)進(jìn)行預(yù)測(cè),并對(duì)未來(lái)可能出現(xiàn)的問(wèn)題提出自己看法與對(duì)策。
下面來(lái)重點(diǎn)介紹《大數(shù)據(jù)時(shí)代》這本書的主要內(nèi)容。
《大數(shù)據(jù)時(shí)代》開篇就講了Google通過(guò)人們?cè)谒阉饕嫔纤阉麝P(guān)鍵字留下的數(shù)據(jù)提前成功的預(yù)測(cè)了2009年美國(guó)的H1N1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。Google的預(yù)測(cè)比政府提前將近一個(gè)月,相比之下政府只能夠在流感爆發(fā)一兩個(gè)周之后才可以弄到相關(guān)的數(shù)據(jù)。同時(shí)Google的預(yù)測(cè)與政府?dāng)?shù)據(jù)的相關(guān)性高達(dá)97%,這也就意味著Google預(yù)測(cè)數(shù)據(jù)的置信區(qū)間為3%,這個(gè)數(shù)字遠(yuǎn)遠(yuǎn)小于傳統(tǒng)統(tǒng)計(jì)學(xué)上的常規(guī)置信區(qū)間5%!而這個(gè)數(shù)字就是大數(shù)據(jù)時(shí)代預(yù)測(cè)結(jié)果的相對(duì)準(zhǔn)確性與事件的可預(yù)測(cè)性的最好證明!通過(guò)這一事以及其他的案例,維克托提出了在大數(shù)據(jù)時(shí)代“樣本=總體”的思想。我們都知道當(dāng)樣本無(wú)限趨近于總體的時(shí)候,通過(guò)計(jì)算得到的描述性數(shù)據(jù)將無(wú)限的趨近于事件本身的性質(zhì)。而之前采取的“樣本<總體”的做法很大程度上無(wú)法做到更進(jìn)一步的描述事物,因?yàn)橹暗臅r(shí)代數(shù)據(jù)的獲取與存儲(chǔ)處理本身有很大的難度只導(dǎo)致人們采取抽樣的方式來(lái)測(cè)量事物。而互聯(lián)網(wǎng)終端與計(jì)算機(jī)的出現(xiàn)使數(shù)據(jù)的獲取、存儲(chǔ)與處理難度大大降低,因而相對(duì)準(zhǔn)確性更高的“樣本=總體”的測(cè)算方式將成為大數(shù)據(jù)時(shí)代的主流,同時(shí)大數(shù)據(jù)時(shí)代本身也是建立在大批量數(shù)據(jù)的存儲(chǔ)與處理的基礎(chǔ)之上的。
接下來(lái),維克多又通過(guò)了IBM追求高精確性的電腦翻譯計(jì)劃的失敗與Google只是將所有出現(xiàn)過(guò)的相應(yīng)的文字語(yǔ)句掃描并儲(chǔ)存在詞庫(kù)中,所以無(wú)論需要翻譯什么,只要有聯(lián)系Google詞庫(kù)就會(huì)出現(xiàn)翻譯,雖然有的時(shí)候的翻譯很無(wú)厘頭,但是大多數(shù)時(shí)候還是正確的,所以Google的電腦翻譯的計(jì)劃的成功,表明大數(shù)據(jù)時(shí)代對(duì)準(zhǔn)確性的追求并不是特別明顯,但是相反大數(shù)據(jù)時(shí)代是建立在大數(shù)據(jù)的基礎(chǔ)住上的,所以大數(shù)據(jù)時(shí)代追求的是全方位覆蓋的數(shù)字測(cè)度而不管其準(zhǔn)確性到底有多高,因?yàn)榇罅康臄?shù)據(jù)會(huì)湮埋少數(shù)有問(wèn)題的數(shù)據(jù)所帶來(lái)的影響。同時(shí)大量的數(shù)據(jù)也會(huì)無(wú)限的逼近事物的原貌。
之后,維克托又預(yù)測(cè)了一個(gè)在大數(shù)據(jù)時(shí)代催生的重要職業(yè)——數(shù)據(jù)科學(xué)家,這是一群數(shù)學(xué)家、統(tǒng)計(jì)學(xué)與編程家的綜合體,這一群人將能夠從獲取的數(shù)據(jù)中得到任何他們想要的結(jié)果。換言之,只要數(shù)據(jù)充足我們的一切外在的與內(nèi)在的我們不想讓他人知道的東西都見(jiàn)會(huì)在這一群家伙的面前展現(xiàn)得淋漓盡致。所以為了避免個(gè)人隱私在大數(shù)據(jù)時(shí)代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數(shù)據(jù)為商業(yè)部門服務(wù),而另一群人則負(fù)責(zé)審查這一些人是否合法的獲得與應(yīng)用數(shù)據(jù),是否侵犯了個(gè)人隱私。
無(wú)論如何,大數(shù)據(jù)時(shí)代將會(huì)到來(lái),不管我們接受還是不接受!
我覺(jué)得《大數(shù)據(jù)時(shí)代》這本書寫的很好,很值得一讀。因?yàn)闀?huì)給我們很多啟發(fā),比如你在相關(guān)的社交網(wǎng)站發(fā)表的言論或者照片都很有可能被“數(shù)據(jù)科學(xué)家”們利用,從而再將相關(guān)數(shù)據(jù)賣給各大網(wǎng)店。不過(guò),事實(shí)就是我們將會(huì)成為被預(yù)測(cè)被引誘的對(duì)象。所以說(shuō),小心你在網(wǎng)上留下的痕跡。
我喜歡這本書是因?yàn)樗o我展現(xiàn)了一個(gè)新的世界。
【《大數(shù)據(jù)時(shí)代》讀書筆記】相關(guān)文章:
《大數(shù)據(jù)時(shí)代》的讀書心得03-11
大數(shù)據(jù)時(shí)代經(jīng)典語(yǔ)錄02-02
大數(shù)據(jù)時(shí)代閱讀理解附答案01-17
小時(shí)代讀書筆記01-06
小時(shí)代的讀書筆記01-16