2023大數(shù)據(jù)時代讀書心得體會
2023大數(shù)據(jù)時代讀書心得體會(5篇)
現(xiàn)在是大數(shù)據(jù)時代讀書的時代!寫2023大數(shù)據(jù)時代讀書心得體會是一個不錯的選擇,這樣有利于培養(yǎng)我們思考的習(xí)慣。下面是小編給大家?guī)淼?023大數(shù)據(jù)時代讀書心得體會5篇,希望大家喜歡!
2023大數(shù)據(jù)時代讀書心得體會【篇1】
如今說起新媒體和互聯(lián)網(wǎng),必提大數(shù)據(jù),似乎不這樣說就OUT了。而且人云亦云的居多,不少談?wù)撜呱踔吝€沒有認(rèn)真讀過這方面的經(jīng)典著作——舍恩佰格的《大數(shù)據(jù)時代》。維克托·邁爾舍恩伯格何許人也?他現(xiàn)任牛津大學(xué)網(wǎng)絡(luò)學(xué)院互聯(lián)網(wǎng)研究所治理與監(jiān)管專業(yè)教授,曾任哈佛大學(xué)肯尼迪學(xué)院信息監(jiān)管科研項(xiàng)目負(fù)責(zé)人。他的咨詢客戶包括微軟、惠普和IBM等全球企業(yè),他是歐盟互聯(lián)網(wǎng)官方政策背后真正的制定者和參與者,他還先后擔(dān)任多國政府高層的智囊。這位被譽(yù)為:大數(shù)據(jù)時代的。預(yù)言家“的牛津教授真牛!那么,這位大師說的都是金科玉律嗎?并不一定,讀大師的作品一定要做些功課才好讀懂,才能能與之進(jìn)行一場思想上的對話。
舍恩伯格分三部分來討論大數(shù)據(jù),即思維變革、商業(yè)變革和管理變革。
在第一部分”大數(shù)據(jù)時代的思維變革“中,舍恩伯格旗幟鮮明的亮出他的三個觀點(diǎn):
一、更多:不是隨機(jī)樣本,而是全體數(shù)據(jù)。
二、更雜:不是精確性,而是混雜性。
三、更好:不是因果關(guān)系,而是相關(guān)關(guān)系。對于第一個觀點(diǎn),我不敢茍同。
一方面是對全體數(shù)據(jù)進(jìn)行處理,在技術(shù)和設(shè)備上有相當(dāng)高的難度。另一方面是不是都有此必要,對于簡單事實(shí)進(jìn)行判斷的數(shù)據(jù)分析難道也要采集全體數(shù)據(jù)嗎?
我曾與香港城市大學(xué)的祝建華教授討論過。祝教授是傳播學(xué)研究方法和數(shù)據(jù)分析的專家,他認(rèn)為一定可以找到一種數(shù)理統(tǒng)計方法來進(jìn)行分析,并不一定需要全部數(shù)據(jù)。聯(lián)系到舍恩伯格第二個觀點(diǎn)中所說的相關(guān)關(guān)系,我理解他說的全體數(shù)據(jù)不是指數(shù)量而是指范圍,即大數(shù)據(jù)的隨機(jī)樣本不限于目標(biāo)數(shù)據(jù),還包括目標(biāo)以外的所有數(shù)據(jù)。我認(rèn)為大數(shù)據(jù)分析不能排除隨機(jī)抽樣,只是抽樣的方法和范圍要加以拓展。
我同意舍恩伯格的第二觀點(diǎn),我認(rèn)為這是對他第一個觀點(diǎn)很好的補(bǔ)充,這也是對精準(zhǔn)傳播和精準(zhǔn)營銷的一種反思?!贝髷?shù)據(jù)的簡單算法比小數(shù)據(jù)的復(fù)雜算法更有效?!案哂泻暧^視野和東方哲學(xué)思維。對于舍恩伯格的第三個觀點(diǎn),我也不能完全贊同。”不是因果關(guān)系,而是相關(guān)關(guān)系?!安恍枰馈睘槭裁础埃恍枰馈笔鞘裁础?。傳播即數(shù)據(jù),數(shù)據(jù)即關(guān)系。在小數(shù)據(jù)時代人們只關(guān)心因果關(guān)系,對相關(guān)關(guān)系認(rèn)識不足,大數(shù)據(jù)時代相關(guān)關(guān)系舉足輕重,如何強(qiáng)調(diào)都不為過,但不應(yīng)該完全排斥它。大數(shù)據(jù)從何而來?為何而用?如果我們完全忽略因果關(guān)系,不知道大數(shù)據(jù)產(chǎn)生的前因后果,也就消解了大數(shù)據(jù)的人文價值。如今不少學(xué)者為了闡述和傳播其觀點(diǎn)往往語出驚人,對舊有觀念進(jìn)行徹底的否定。
世間萬物的復(fù)雜性多樣化并非非此即彼那么簡單,舍恩伯格也是這種二元對立的幼稚思維嗎?其實(shí)不然,讀者在閱讀時一定要看清楚他是在什么語境下說的,不要因囫圇吞棗的淺讀而陷入斷章取義的誤讀。比如說舍恩伯格在提出”不是因果關(guān)系,而是相關(guān)關(guān)系?!斑@一論斷時,他在書中還說道:”在大多數(shù)情況下,一旦我們完成了對大數(shù)據(jù)的相關(guān)關(guān)系分析,而又不再滿足于僅僅知道‘是什么’時,我們就會繼續(xù)向更深層次研究的因果關(guān)系,找出背后的‘為什么’?!癧i]由此可見,他說的全體數(shù)據(jù)和相關(guān)關(guān)系都在特定語境下的,是在數(shù)據(jù)挖掘中的選項(xiàng)。
大數(shù)據(jù)研究的一大驅(qū)動力就是商用,舍恩伯格在第二部分里討論了大數(shù)據(jù)時代的商業(yè)變革。舍恩伯格認(rèn)為數(shù)據(jù)化就是一切皆可”量化“,大數(shù)據(jù)的定量分析有力地回答”是什么“這一問題,但仍然無法完全回答”為什么“。因此,我認(rèn)為并不能排除定性分析和質(zhì)化研究。數(shù)據(jù)創(chuàng)新可以創(chuàng)造價值,這是毫無疑問的。舍恩伯格在討論大數(shù)據(jù)的角色定位時仍把它置于數(shù)據(jù)應(yīng)用的商業(yè)系統(tǒng)中,而沒有把它置于整個社會系統(tǒng)里,但他在第二部分大數(shù)據(jù)時代的管理變革中討論了這個問題。
在風(fēng)險社會中信息安全問題日趨凸顯。如何擺脫大數(shù)據(jù)的困境?舍恩伯格在最后一節(jié)”掌控“中試圖回答,但基本上屬于老生常談。我想,或許凱文·凱利的《失控》可以幫助我們解答這個問題?至少可以提供更多的思考維度。正如舍恩伯格在結(jié)語中所道:”大數(shù)據(jù)并不是一個充斥著算法和機(jī)器的冰冷世界,人類的作用依然無法被完全替代。大數(shù)據(jù)為我們提供的不是最終答案,只是參考的答案,幫助是暫時的,而更好的方法和答案還在不久的未來?!爸x謝舍恩伯格!讓大數(shù)據(jù)討論從自然科學(xué)回到人文社科。由此推斷,《大數(shù)據(jù)時代》不是最終答案,也不是標(biāo)準(zhǔn)答案,只是參考的答案。
此外,在閱讀此書之前還必須具備一些數(shù)據(jù)科學(xué)的基本知識和基本概念,比如說什么叫數(shù)據(jù)?什么叫大數(shù)據(jù)?數(shù)據(jù)分析與數(shù)據(jù)挖掘的區(qū)別,數(shù)字化與數(shù)據(jù)化有什么不同?讀前做些功課讀起來就比較好懂了。
2023大數(shù)據(jù)時代讀書心得體會【篇2】
信息時代的到來,我們感受到的是技術(shù)變化日新月異,隨之而來的是生活方式的轉(zhuǎn)變我們這樣評論著的信息時代已經(jīng)變?yōu)樵?jīng)。如今,大數(shù)據(jù)時代成為炙手可熱的話題。筆者在這說明信息和數(shù)據(jù),只是試圖首先說明信息、數(shù)據(jù)的關(guān)系和不同,也試圖說明,為什么信息時代轉(zhuǎn)變?yōu)榱舜髷?shù)據(jù)時代?大數(shù)據(jù)時代帶給了我們什么?
信息和數(shù)據(jù)的定義。維基百科解釋:信息,又稱資訊,是一個高度概括抽象概念,是一個發(fā)展中的動態(tài)范疇,是進(jìn)行互相交換的內(nèi)容和名稱,信息的界定沒有統(tǒng)一的定義,但是信息具備客觀、動態(tài)、傳遞、共享、經(jīng)濟(jì)等特性卻是大家的共識。數(shù)據(jù):或稱資料,指描述事物的符號記錄,是可定義為意義的實(shí)體,它涉及到事物的存在形式。它是關(guān)于事件之一組離散且客觀的事實(shí)描述,是構(gòu)成信息和知識的原始材料。數(shù)據(jù)可分為模擬數(shù)據(jù)和數(shù)字?jǐn)?shù)據(jù)兩大類。數(shù)據(jù)指計算機(jī)加工的“原料”,如圖形、聲音、文字、數(shù)、字符和符號等。從定義看來,數(shù)據(jù)是原始的處女地,需要耕耘。信息則是已經(jīng)處理過的可以傳播的資訊。信息時代依賴于數(shù)據(jù)的爆發(fā),只是當(dāng)數(shù)據(jù)爆發(fā)到無法駕馭的狀態(tài),大數(shù)據(jù)時代應(yīng)運(yùn)而生。這是否是《大數(shù)據(jù)時代》一書所未曾闡述的背景材料?
在《大數(shù)據(jù)時代》一書中,大數(shù)據(jù)時代與小數(shù)據(jù)時代的區(qū)別:
1、思維慣例。大數(shù)據(jù)時代區(qū)別與轉(zhuǎn)變就是,放棄對因果關(guān)系的渴求,而取而代之關(guān)注相關(guān)關(guān)系。也就是說只要知道“是什么”,而不需要知道“為什么”。作者語言絕對,卻反思其本質(zhì)區(qū)別。數(shù)據(jù)的更多、更雜,導(dǎo)致應(yīng)用主意只能盡量觀察,而不是傾其所有進(jìn)行推理?這也是明智之舉。
2、使用用途。小數(shù)據(jù)停留在說明過去,大數(shù)據(jù)用驅(qū)動過去來預(yù)測未來。筆者認(rèn)為數(shù)據(jù)的用途意在何為,與數(shù)據(jù)本身無關(guān),而與數(shù)據(jù)的解讀者有關(guān),而相關(guān)關(guān)系更有利于預(yù)測未來。
3、結(jié)構(gòu)。大數(shù)據(jù)更多的體現(xiàn)在海量非結(jié)構(gòu)化數(shù)據(jù)本身與處理方法的整合。大數(shù)據(jù)更像是理論與現(xiàn)實(shí)齊頭并進(jìn),理論來創(chuàng)立處理非結(jié)構(gòu)化數(shù)據(jù)的方法,處理結(jié)果與未來進(jìn)行驗(yàn)證。
4、分析基礎(chǔ)。大數(shù)據(jù)是在互聯(lián)網(wǎng)背景下數(shù)據(jù)從量變到質(zhì)變的過程。筆者認(rèn)為,小數(shù)據(jù)時代也即是信息時代,是大數(shù)據(jù)時代的前提,大數(shù)據(jù)時代是升華和進(jìn)化,本質(zhì)是相輔相成,而并非相離互斥。
數(shù)據(jù)未來的故事。數(shù)據(jù)的發(fā)展,給我們帶來什么預(yù)期和啟示?銀行業(yè)天然有大數(shù)據(jù)的潛質(zhì)??蛻魯?shù)據(jù)、交易數(shù)據(jù)、管理數(shù)據(jù)等海量數(shù)據(jù)不斷增長,海量機(jī)遇和挑戰(zhàn)也隨之而來,適應(yīng)變革,適者生存。我們可以有更廣闊的業(yè)務(wù)發(fā)展空間、可以有更精準(zhǔn)的決策判斷能力、可以有更優(yōu)秀的經(jīng)營管理能力可以這些都基于數(shù)據(jù)的收集、整理、駕馭、分析能力,基于脫穎而出的創(chuàng)新思維和執(zhí)行。因此,建設(shè)“數(shù)據(jù)倉庫”,培養(yǎng)“數(shù)據(jù)思維”,養(yǎng)成“數(shù)據(jù)治理”,創(chuàng)造“數(shù)據(jù)融合”,實(shí)現(xiàn)“數(shù)據(jù)應(yīng)用”才能擁抱“大數(shù)據(jù)”時代,從數(shù)據(jù)中攫取價值,笑看風(fēng)云變換,穩(wěn)健贏取未來。
2023大數(shù)據(jù)時代讀書心得體會【篇3】
這本書里主要介紹的是大數(shù)據(jù)在現(xiàn)代商業(yè)運(yùn)作上的應(yīng)用,以及它對現(xiàn)代商業(yè)運(yùn)作的影響。
《大數(shù)據(jù)時代》這本書的結(jié)構(gòu)框架遵從了學(xué)術(shù)性書籍的普遍方式。也既,從現(xiàn)象入手,繼而通過對現(xiàn)象的解剖提出對這一現(xiàn)象的解釋。然后在通過解釋在對未來進(jìn)行預(yù)測,并對未來可能出現(xiàn)的問題提出自己看法與對策。
下面來重點(diǎn)介紹《大數(shù)據(jù)時代》這本書的主要內(nèi)容。
《大數(shù)據(jù)時代》開篇就講了Google通過人們在搜索引擎上搜索關(guān)鍵字留下的數(shù)據(jù)提前成功的預(yù)測了20__年美國的H1N1的爆發(fā)地與傳播方向以及可能的潛在患者的事情。Google的預(yù)測比政府提前將近一個月,相比之下政府只能夠在流感爆發(fā)一兩個周之后才可以弄到相關(guān)的數(shù)據(jù)。同時Google的預(yù)測與政府?dāng)?shù)據(jù)的相關(guān)性高達(dá)97%,這也就意味著Google預(yù)測數(shù)據(jù)的置信區(qū)間為3%,這個數(shù)字遠(yuǎn)遠(yuǎn)小于傳統(tǒng)統(tǒng)計學(xué)上的常規(guī)置信區(qū)間5%!而這個數(shù)字就是大數(shù)據(jù)時代預(yù)測結(jié)果的相對準(zhǔn)確性與事件的可預(yù)測性的最好證明!通過這一事以及其他的案例,維克托提出了在大數(shù)據(jù)時代“樣本=總體”的思想。我們都知道當(dāng)樣本無限趨近于總體的時候,通過計算得到的描述性數(shù)據(jù)將無限的趨近于事件本身的性質(zhì)。而之前采取的“樣本<總體”的做法很大程度上無法做到更進(jìn)一步的描述事物,因?yàn)橹暗臅r代數(shù)據(jù)的獲取與存儲處理本身有很大的難度只導(dǎo)致人們采取抽樣的方式來測量事物。而互聯(lián)網(wǎng)終端與計算機(jī)的出現(xiàn)使數(shù)據(jù)的獲取、存儲與處理難度大大降低,因而相對準(zhǔn)確性更高的“樣本=總體”的`測算方式將成為大數(shù)據(jù)時代的主流,同時大數(shù)據(jù)時代本身也是建立在大批量數(shù)據(jù)的存儲與處理的基礎(chǔ)之上的。
接下來,維克多又通過了IBM追求高精確性的電腦翻譯計劃的失敗與Google只是將所有出現(xiàn)過的相應(yīng)的文字語句掃描并儲存在詞庫中,所以無論需要翻譯什么,只要有聯(lián)系Google詞庫就會出現(xiàn)翻譯,雖然有的時候的翻譯很無厘頭,但是大多數(shù)時候還是正確的,所以Google的電腦翻譯的計劃的成功,表明大數(shù)據(jù)時代對準(zhǔn)確性的追求并不是特別明顯,但是相反大數(shù)據(jù)時代是建立在大數(shù)據(jù)的基礎(chǔ)住上的,所以大數(shù)據(jù)時代追求的是全方位覆蓋的數(shù)字測度而不管其準(zhǔn)確性到底有多高,因?yàn)榇罅康臄?shù)據(jù)會湮埋少數(shù)有問題的數(shù)據(jù)所帶來的影響。同時大量的數(shù)據(jù)也會無限的逼近事物的原貌。
之后,維克托又預(yù)測了一個在大數(shù)據(jù)時代催生的重要職業(yè)——數(shù)據(jù)科學(xué)家,這是一群數(shù)學(xué)家、統(tǒng)計學(xué)與編程家的綜合體,這一群人將能夠從獲取的數(shù)據(jù)中得到任何他們想要的結(jié)果。換言之,只要數(shù)據(jù)充足我們的一切外在的與內(nèi)在的我們不想讓他人知道的東西都見會在這一群家伙的面前展現(xiàn)得淋漓盡致。所以為了避免個人隱私在大數(shù)據(jù)時代被這一群人利用,維克托建議將這一群人分為兩部分,一部分使用數(shù)據(jù)為商業(yè)部門服務(wù),而另一群人則負(fù)責(zé)審查這一些人是否合法的獲得與應(yīng)用數(shù)據(jù),是否侵犯了個人隱私。
無論如何,大數(shù)據(jù)時代將會到來,不管我們接受還是不接受!
我覺得《大數(shù)據(jù)時代》這本書寫的很好,很值得一讀。因?yàn)闀o我們很多啟發(fā),比如你在相關(guān)的社交網(wǎng)站發(fā)表的言論或者照片都很有可能被“數(shù)據(jù)科學(xué)家”們利用,從而再將相關(guān)數(shù)據(jù)賣給各大網(wǎng)店。不過,事實(shí)就是我們將會成為被預(yù)測被引誘的對象。所以說,小心你在網(wǎng)上留下的痕跡。
我喜歡這本書是因?yàn)樗o我展現(xiàn)了一個新的世界。
2023大數(shù)據(jù)時代讀書心得體會【篇4】
讀了《大數(shù)據(jù)時代》后,感覺到一個大變革的時代將要來臨。雖然還不怎么明了到底要徹底改變哪些思維和操作方式,但顯然作者想要“終結(jié)”或顛覆一些傳統(tǒng)上作為我們思維和生存基本理論、方法和方式。在這樣的想法面前,我的思想被強(qiáng)烈震撼,不禁戰(zhàn)栗起來。
“在小數(shù)據(jù)時代,我們會假象世界是怎樣運(yùn)作的,然后通過收集和分析數(shù)據(jù)來驗(yàn)證這種假想。”“隨著由假想時代到數(shù)據(jù)時代的過渡,我們也很可能認(rèn)為我們不在需要理論了?!睍袔缀蹩隙ㄒ嵏步y(tǒng)計學(xué)的理論和方法,也試圖通過引用《連線》雜志主編安德森的話“量子物理學(xué)的理論已經(jīng)脫離實(shí)際”來“終結(jié)”量子力學(xué)。對此我很高興,因?yàn)榻y(tǒng)計學(xué)和量子力學(xué)都是我在大學(xué)學(xué)習(xí)時學(xué)到抽筋都不能及格的課目。但這兩個理論實(shí)在太大,太權(quán)威,太基本了,我想我不可能靠一本書就能擺脫這兩個讓我頭疼一輩子的東西。作者其實(shí)也不敢旗幟鮮明地提出要顛覆它們的論點(diǎn),畢竟還是在前面加上了“很可能認(rèn)為”這樣的保護(hù)傘。
近幾十年,我們總是在遇到各種各樣的新思維。在新思維面前我們首先應(yīng)該做到的就是要破和立,要改變自己的傳統(tǒng),跟上時代的腳步。即使腦子還跟不上,嘴巴上也必須跟上,否則可能會被扣上思想僵化甚至阻礙世界發(fā)展的大帽子。既然大數(shù)據(jù)是“通往未來的必然改變”,那我就必須“不受限于傳統(tǒng)的思維模式和特定領(lǐng)域里隱含的固有偏見”,跟作者一起先把統(tǒng)計學(xué)和量子力學(xué)否定掉再說。反正我也不喜歡、也學(xué)不會它們。
當(dāng)我們?nèi)祟惖臄?shù)據(jù)收集和處理能力達(dá)到拍字節(jié)甚至更大之后,我們可以把樣本變成全部,再加上有能力正視混雜性而忽視精確性后,似乎真的可以拋棄以抽樣調(diào)查為基礎(chǔ)的統(tǒng)計學(xué)了。但是由統(tǒng)計學(xué)和量子力學(xué)以及其他很多“我們也很可能認(rèn)為我們不再需要的”理論上溯,它們幾乎都基于一個共同的基礎(chǔ)——邏輯。要是不小心把邏輯或者邏輯思維或者邏輯推理一起給“不再需要”的話,就讓我很擔(dān)心了!
《大數(shù)據(jù)時代》第16頁“大數(shù)據(jù)的核心就是預(yù)測”。邏輯是——描述時空信息“類”與“類”之間長時間有效不變的先后變化關(guān)系規(guī)則。兩者似乎是做同一件事??纱髷?shù)據(jù)要的“不是因果關(guān)系,而是相關(guān)關(guān)系”,“知道是什么就夠了,沒必要知道為什么”,而邏輯學(xué)四大基本定律(同一律、矛盾律、排中律和充足理由律)中的充足理由律又“明確規(guī)定”任何事物都有其存在的充足理由。且邏輯推理三部分——?dú)w納邏輯、溯因邏輯和演繹邏輯都是基于因果關(guān)系。兩者好像又是對立的。在同一件事上兩種方法對立,應(yīng)該只有一個結(jié)果,就是要否定掉其中之一。這就是讓我很擔(dān)心的原因。
可我卻不能拭目以待,像旁觀者一樣等著哪一個“脫穎而出”,因?yàn)槲疑硖幤渲小栴}不解決,我就沒法思考和工作,自然就沒法活了!更何況還有兩個更可怕的事情。
其一:量子力學(xué)搞了一百多年,為了處理好混雜性問題,把質(zhì)量和速度結(jié)合到能量上去了,為了調(diào)和量子力學(xué)與相對論的矛盾,又搞出一個量子場論,再七搞八搞又有了蟲洞和羅森橋,最后把四維的時空彎曲成允許時間旅行的樣子,恨不得馬上造成那可怕的時間旅行機(jī)器。唯一阻止那些“愛因斯坦”們“瞎胡鬧”的就是因果關(guān)系,因?yàn)榘职志褪前职?,兒子就是兒子。那么大?shù)據(jù)會不會通過正視混雜性,放棄因果關(guān)系最后反而搞出時間機(jī)器,讓爸爸不再是爸爸,兒子不再是兒子了呢?其二:人和機(jī)器的根本區(qū)別在于人有邏輯思維而機(jī)器沒有?!洞髷?shù)據(jù)時代》也擔(dān)心“最后做出決策的將是機(jī)器而不是人”。如果真的那一天因?yàn)榉艞夁壿嬎季S而出現(xiàn)科幻電影上描述的機(jī)器主宰世界消滅人類的結(jié)果,那我還不如現(xiàn)在就趁早跳樓。
還好我知道自己對什么統(tǒng)計學(xué)、量子力學(xué)、邏輯學(xué)和大數(shù)據(jù)來說都是門外漢,也許上面一大篇都是在胡說八道,所謂的擔(dān)心根本不存在。但問題出現(xiàn)了,還是解決的好,不然沒法睡著覺。自己解決不了就只能依靠專家來指點(diǎn)迷津。
所以想向《大數(shù)據(jù)時代》的作者提一個合理化建議:把這本書繼續(xù)寫下去,至少加一個第四部分——大數(shù)據(jù)時代的邏輯思維。
2023大數(shù)據(jù)時代讀書心得體會【篇5】
《大數(shù)據(jù)時代》是英國維克托·邁爾—舍恩伯格教授的著作,這本書也被尊為國外大數(shù)據(jù)研究的先河之作。這本書最大的優(yōu)點(diǎn)就在于作者利用上百個例子來對大數(shù)據(jù)的方方面面做了詳細(xì)解說,讓外行也很容易理解。結(jié)構(gòu)上,作者通過大數(shù)據(jù)時代的思維變革、商業(yè)變革和管理變革三個角度依次闡述,條理清晰。
所謂大數(shù)據(jù),按作者的說法,就是所有數(shù)據(jù)。隨著計算機(jī)運(yùn)算速度和存儲能力的發(fā)展,收集數(shù)據(jù)變得越來越簡單,儲存數(shù)據(jù)的成本越來越低。在過去,由于技術(shù)限制,人們做統(tǒng)計時只能收集有限的數(shù)據(jù)做樣本,其中要考慮隨機(jī)樣本的選擇,努力減小因樣本問題出現(xiàn)的誤差;統(tǒng)計結(jié)果往往不能重復(fù)使用,造成數(shù)據(jù)利用率低。而現(xiàn)在則可以做到樣本=總體。數(shù)據(jù)的增多帶來不可避免的精確性問題。小數(shù)據(jù)時代,一個樣本的錯誤就可以造成對總體估計的失敗,幸運(yùn)的是,大數(shù)據(jù)時代對精確性不再那么要求苛刻——也無法要求太嚴(yán)格——數(shù)據(jù)的數(shù)量足以彌補(bǔ)這一缺陷。在對思維變革這一部分的闡述中,最重要也是全書的核心觀點(diǎn)就是大數(shù)據(jù)時代,我們應(yīng)該從追求因果關(guān)系的舊思維方式向追求相關(guān)關(guān)系轉(zhuǎn)變。
在我看來,這實(shí)際上是通過大數(shù)據(jù)來透視一種事物的發(fā)展趨勢,而很多精確學(xué)科領(lǐng)域依然需要探尋因果關(guān)系解決更有針對性的問題,所以,這局限了這一轉(zhuǎn)變只能在特定的領(lǐng)域發(fā)生。作者自己也說,大數(shù)據(jù)的相關(guān)性將人們指向了比探討因果關(guān)系更有前景的領(lǐng)域。
大數(shù)據(jù)時代的數(shù)據(jù)獲取方式是多種多樣,數(shù)據(jù)形式也是千變?nèi)f化,任何文字、行為、萬物都可以被數(shù)據(jù)化后用來分析。對這些數(shù)據(jù)的利用,不僅要考慮到其初次使用價值,更要放眼它未來可能的用途以提高數(shù)據(jù)的利用率。當(dāng)然數(shù)據(jù)并不是無限使用,時效、環(huán)境的變化肯定會對數(shù)據(jù)提出新的要求,所以數(shù)據(jù)的折舊也是應(yīng)當(dāng)考慮的。這又引出了對數(shù)據(jù)這一無形資產(chǎn)的估值可能性。對于這樣的公司來說,數(shù)據(jù)就是他們的核心,如何在資產(chǎn)負(fù)債表上給他們一個公正的體現(xiàn)正是我們需要考慮的。
大數(shù)據(jù)時代的價值鏈由三部分構(gòu)成,我把它們簡化為生產(chǎn)—分析—使用三個環(huán)節(jié),這對應(yīng)書中的三種類型公司:第一種是基于數(shù)據(jù)本身的公司,第二種是基于技能,第三種則是基于思維。在大數(shù)據(jù)早期,技能和思維最有價值,但作者認(rèn)為,最終,大部分的價值還是必須從數(shù)據(jù)本身來挖掘。這是假定了一個成熟的市場,人人都了解了大數(shù)據(jù)的用途。
對于普通人來說,大數(shù)據(jù)時代最關(guān)心的`還是隱私問題。不知不覺中,個人的一舉一動都暴露在政府甚至私人企業(yè)之下,還面臨潛在的泄露風(fēng)險。對此,作者提出了使用者承擔(dān)責(zé)任的解決辦法,而不是過去那種流于形式的使用授權(quán)。大數(shù)據(jù)甚至能預(yù)測一個人的犯罪動機(jī),這給監(jiān)管者帶來的難題是,預(yù)測一個人要犯罪,懲罰還是不懲罰?在這點(diǎn)上,社會達(dá)成個人僅需對行為而非動機(jī)負(fù)責(zé)的共識非常重要。
大數(shù)據(jù)時代的風(fēng)險控制靠的是算法師,類似會計師一樣的職業(yè),對大數(shù)據(jù)的準(zhǔn)確度或有效性進(jìn)行鑒定。這能在一定程度上防止數(shù)據(jù)濫用的發(fā)生和數(shù)據(jù)獨(dú)裁。當(dāng)今的法律亦需對大數(shù)據(jù)監(jiān)管進(jìn)行修訂補(bǔ)充。
當(dāng)代大數(shù)據(jù)發(fā)展主要由科技公司推動,相信在不久的將來更多的傳統(tǒng)領(lǐng)域會意識到大數(shù)據(jù)的重要性。但我們也應(yīng)該保持清醒,大數(shù)據(jù)并不是萬能藥,對某些領(lǐng)域或環(huán)節(jié),使用大數(shù)據(jù)是一種簡單且實(shí)用的選擇;但對某些領(lǐng)域,盲目使用大數(shù)據(jù)只會適得其反。