大數(shù)據(jù)分析文章
大數(shù)據(jù)分析文章
作為一個(gè)全新的產(chǎn)業(yè),大數(shù)據(jù)仍然處于快速發(fā)展的初期,這是一個(gè)快速發(fā)展的領(lǐng)域,每時(shí)每刻都在產(chǎn)生新的變化,對(duì)于大數(shù)據(jù)的分析也是越來(lái)越復(fù)雜而且重要。下面是學(xué)習(xí)啦小編為大家整理的關(guān)于大數(shù)據(jù)分析文章的相關(guān)資料,供您參考!
大數(shù)據(jù)分析文章篇1:大數(shù)據(jù)的六大發(fā)展趨勢(shì)
(1)成為重要戰(zhàn)略資源
在未來(lái)一段時(shí)間內(nèi),大數(shù)據(jù)將成為企業(yè)、社會(huì)和國(guó)家層面重要的戰(zhàn)略資源。大數(shù)據(jù)將不斷成為各類(lèi)機(jī)構(gòu),尤其是企業(yè)的重要資產(chǎn),成為提升機(jī)構(gòu)和公司競(jìng)爭(zhēng)力的有力武器。企業(yè)將更加鐘情于用戶數(shù)據(jù),充分利用客戶與其在線產(chǎn)品或服務(wù)交互產(chǎn)生的數(shù)據(jù),并從中獲取價(jià)值。此外,在市場(chǎng)影響方面,大數(shù)據(jù)也將扮演重要角色——影響著廣告、產(chǎn)品推銷(xiāo)和消費(fèi)者行為。
(2)數(shù)據(jù)隱私標(biāo)準(zhǔn)將出臺(tái)
大數(shù)據(jù)將面臨隱私保護(hù)的重大挑戰(zhàn),現(xiàn)有的隱私保護(hù)法規(guī)和技術(shù)手段難以適應(yīng)大數(shù)據(jù)環(huán)境,個(gè)人隱私越來(lái)越難以保護(hù),有可能會(huì)出現(xiàn)有償隱私服務(wù),數(shù)據(jù)“面罩”將會(huì)流行。預(yù)計(jì)各國(guó)都將會(huì)有一系列關(guān)于數(shù)據(jù)隱私的標(biāo)準(zhǔn)和條例出臺(tái)。
(3)與云計(jì)算深度融合
大數(shù)據(jù)處理離不開(kāi)云計(jì)算技術(shù),云計(jì)算為大數(shù)據(jù)提供彈性可擴(kuò)展的基礎(chǔ)設(shè)施支撐環(huán)境以及數(shù)據(jù)服務(wù)的高效模式,大數(shù)據(jù)則為云計(jì)算提供了新的商業(yè)價(jià)值??傮w而言,云計(jì)算、物聯(lián)網(wǎng)、移動(dòng)互聯(lián)網(wǎng)等新興計(jì)算形態(tài),既是產(chǎn)生大數(shù)據(jù)的地方,也是需要大數(shù)據(jù)分析方法的領(lǐng)域。
(4)分析方法發(fā)生變革
大數(shù)據(jù)分析將出現(xiàn)一系列重大變革。就像計(jì)算機(jī)和互聯(lián)網(wǎng)一樣,大數(shù)據(jù)可能是新一波的技術(shù)革命。基于大數(shù)據(jù)的數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)和人工智能可能會(huì)改變小數(shù)據(jù)里的很多算法和基礎(chǔ)理論,這方面很可能會(huì)產(chǎn)生理論級(jí)別的突破。
(5)網(wǎng)絡(luò)安全問(wèn)題凸顯
大數(shù)據(jù)的安全令人擔(dān)憂,大數(shù)據(jù)的保護(hù)越來(lái)越重要。大數(shù)據(jù)的不斷增加,對(duì)數(shù)據(jù)存儲(chǔ)的物理安全性要求會(huì)越來(lái)越高,從而對(duì)數(shù)據(jù)的多副本與容災(zāi)機(jī)制提出更高的要求。網(wǎng)絡(luò)和數(shù)字化生活使得犯罪分子更容易獲得關(guān)于人的信息,也有了更多不易被追蹤和防范的犯罪手段,可能會(huì)出現(xiàn)更高明的騙局。
(6)以數(shù)據(jù)為中心的解決方案與應(yīng)用的興起
世界已經(jīng)不再將應(yīng)用作為獨(dú)有的優(yōu)勢(shì),相反,數(shù)據(jù)則能夠帶來(lái)在B2B和B2C領(lǐng)域內(nèi)確立獨(dú)特優(yōu)勢(shì)的關(guān)鍵點(diǎn)。在數(shù)據(jù)管理中,以數(shù)據(jù)為中心的模式將會(huì)取代傳統(tǒng)以應(yīng)用為中心的模式。
大數(shù)據(jù)分析文章篇2:大數(shù)據(jù)的初步理解
似乎一夜之間,大數(shù)據(jù)(Big Data)變成一個(gè)IT行業(yè)中最時(shí)髦的詞匯。
首先,大數(shù)據(jù)不是什么完完全全的新生事物,Google的搜索服務(wù)就是一個(gè)典型的大數(shù)據(jù)運(yùn)用,根據(jù)客戶的需求,Google實(shí)時(shí)從全球海量的數(shù)字資產(chǎn)(或數(shù)字垃圾)中快速找出最可能的答案,呈現(xiàn)給你,就是一個(gè)最典型的大數(shù)據(jù)服務(wù)。只不過(guò)過(guò)去這樣規(guī)模的數(shù)據(jù)量處理和有商業(yè)價(jià)值的應(yīng)用太少,在IT行業(yè)沒(méi)有形成成型的概念?,F(xiàn)在隨著全球數(shù)字化、網(wǎng)絡(luò)寬帶化、互聯(lián)網(wǎng)應(yīng)用于各行各業(yè),累積的數(shù)據(jù)量越來(lái)越大,越來(lái)越多企業(yè)、行業(yè)和國(guó)家發(fā)現(xiàn),可以利用類(lèi)似的技術(shù)更好地服務(wù)客戶、發(fā)現(xiàn)新商業(yè)機(jī)會(huì)、擴(kuò)大新市場(chǎng)以及提升效率,才逐步形成大數(shù)據(jù)這個(gè)概念。
有一個(gè)有趣的故事是關(guān)于奢侈品營(yíng)銷(xiāo)的。PRADA在紐約的旗艦店中每件衣服上都有RFID碼。每當(dāng)一個(gè)顧客拿起一件PRADA進(jìn)試衣間,RFID會(huì)被自動(dòng)識(shí)別。同時(shí),數(shù)據(jù)會(huì)傳至PRADA總部。每一件衣服在哪個(gè)城市哪個(gè)旗艦店什么時(shí)間被拿進(jìn)試衣間停留多長(zhǎng)時(shí)間,數(shù)據(jù)都被存儲(chǔ)起來(lái)加以分析。如果有一件衣服銷(xiāo)量很低,以往的作法是直接干掉。但如果RFID傳回的數(shù)據(jù)顯示這件衣服雖然銷(xiāo)量低,但進(jìn)試衣間的次數(shù)多。那就能另外說(shuō)明一些問(wèn)題。也許這件衣服的下場(chǎng)就會(huì)截然不同,也許在某個(gè)細(xì)節(jié)的微小改變就會(huì)重新創(chuàng)造出一件非常流行的產(chǎn)品。
還有一個(gè)是關(guān)于中國(guó)糧食統(tǒng)計(jì)的故事。中國(guó)的糧食統(tǒng)計(jì)是一個(gè)老大難的問(wèn)題。中國(guó)的統(tǒng)計(jì),雖然有組織、有流程、有法律,但中央的統(tǒng)計(jì)人員依靠省統(tǒng)計(jì)人員,省靠市,市靠縣,縣靠鎮(zhèn),鎮(zhèn)靠村,最后真正干活或上報(bào)的是基層兼職的調(diào)查人員,由于眾所周知的KPI考核導(dǎo)向的原因,層層加碼,幾乎沒(méi)有人相信這個(gè)調(diào)查數(shù)據(jù),而其中國(guó)家統(tǒng)計(jì)局的人是最不信的。在前兩年北京的一個(gè)會(huì)議上,原國(guó)家統(tǒng)計(jì)局總經(jīng)濟(jì)師姚景源向我們講述了他們是如何做的。他們采用遙感衛(wèi)星,通過(guò)圖像識(shí)別,把中國(guó)所有的耕地標(biāo)識(shí)、計(jì)算出來(lái),然后把中國(guó)的耕地網(wǎng)格化,對(duì)每個(gè)網(wǎng)格的耕地抽樣進(jìn)行跟蹤、調(diào)查和統(tǒng)計(jì),然后按照統(tǒng)計(jì)學(xué)的原理,計(jì)算(或者說(shuō)估算)出中國(guó)整體的整體糧食數(shù)據(jù)。這種做法是典型采用大數(shù)據(jù)建模的方法,打破傳統(tǒng)流程和組織,直接獲得最終的結(jié)果。
從這些案例來(lái)看,大數(shù)據(jù)并不是很神奇的事情。就如同電影《永無(wú)止境》提出的問(wèn)題:人類(lèi)通常只使用了20%的大腦,如果剩余80%大腦潛能被激發(fā)出來(lái),世界會(huì)變得怎樣?在企業(yè)、行業(yè)和國(guó)家的管理中,通常只有效使用了不到20%的數(shù)據(jù)(甚至更少),如果剩余80%數(shù)據(jù)的價(jià)值激發(fā)起來(lái),世界會(huì)變得怎么樣呢?特別是隨著海量數(shù)據(jù)的新摩爾定律,數(shù)據(jù)爆發(fā)式增長(zhǎng),然后數(shù)據(jù)又得到更有效應(yīng)用,世界會(huì)怎么樣呢?
單個(gè)的數(shù)據(jù)并沒(méi)有價(jià)值,但越來(lái)越多的數(shù)據(jù)累加,量變就會(huì)引起質(zhì)變,就好像一個(gè)人的意見(jiàn)并不重要,但1千人、1萬(wàn)人的意見(jiàn)就比較重要,上百萬(wàn)人就足以掀起巨大的波瀾,上億人足以改變一切。
數(shù)據(jù)再多,但如果被屏蔽或者沒(méi)有被使用,也是沒(méi)有價(jià)值的。中國(guó)的航班晚點(diǎn)非常多,相比之下美國(guó)航班準(zhǔn)點(diǎn)情況好很多。這其中,美國(guó)航空管制機(jī)構(gòu)一個(gè)的好做法發(fā)揮了積極的作用,說(shuō)起來(lái)也非常簡(jiǎn)單,就是美國(guó)會(huì)公布每個(gè)航空公司、每一班航空過(guò)去一年的晚點(diǎn)率和平均晚點(diǎn)時(shí)間,這樣客戶在購(gòu)買(mǎi)機(jī)票的時(shí)候就很自然會(huì)選擇準(zhǔn)點(diǎn)率高的航班,從而通過(guò)市場(chǎng)手段牽引各航空公司努力提升準(zhǔn)點(diǎn)率。這個(gè)簡(jiǎn)單的方法比任何管理手段(如中國(guó)政府的宏觀調(diào)控手段)都直接和有效。這里多說(shuō)一兩句,過(guò)去一個(gè)暴政國(guó)家對(duì)內(nèi)的控制主要是物理上的暴力,就是強(qiáng)力機(jī)構(gòu)權(quán)力無(wú)限大,搞國(guó)家恐怖主義;而現(xiàn)在一個(gè)暴政國(guó)家,主要是就靠壟斷信息、封鎖信息,讓民眾難以獲得廣泛而真實(shí)的信息,從而實(shí)現(xiàn)國(guó)家的控制。這個(gè)信息封鎖,就是對(duì)大數(shù)據(jù)的封鎖。
沒(méi)有整合和挖掘的數(shù)據(jù),價(jià)值也呈現(xiàn)不出來(lái)?!队罒o(wú)止境》中的庫(kù)珀如果不能把海量信息圍繞某個(gè)公司的股價(jià)整合起來(lái)、串聯(lián)起來(lái),這些信息就沒(méi)有價(jià)值。
因此,海量數(shù)據(jù)的產(chǎn)生、獲取、挖掘及整合,使之展現(xiàn)出巨大的商業(yè)價(jià)值,這就是我理解的大數(shù)據(jù)。在互聯(lián)網(wǎng)對(duì)一切重構(gòu)的今天,這些問(wèn)題都不是問(wèn)題。因?yàn)?,我認(rèn)為大數(shù)據(jù)是互聯(lián)網(wǎng)深入發(fā)展的下一波應(yīng)用,是互聯(lián)網(wǎng)發(fā)展的自然延伸。目前,可以說(shuō)大數(shù)據(jù)的發(fā)展到了一個(gè)臨界點(diǎn),因此才成為IT行業(yè)中最熱門(mén)的詞匯之一。
二、大數(shù)據(jù)將重構(gòu)很多行業(yè)的商業(yè)思維和商業(yè)模式
我想以對(duì)未來(lái)汽車(chē)行業(yè)的狂野想象來(lái)展開(kāi)這個(gè)題目。
在人的一生中,汽車(chē)是一項(xiàng)巨大的投資。以一部30萬(wàn)車(chē)、七年換車(chē)周期來(lái)算,每年折舊費(fèi)4萬(wàn)多(這里還不算資金成本),加上停車(chē)、保險(xiǎn)、油、維修、保養(yǎng)等各項(xiàng)費(fèi)用,每年耗費(fèi)應(yīng)在6萬(wàn)左右。汽車(chē)產(chǎn)業(yè)也是一個(gè)很長(zhǎng)產(chǎn)業(yè)鏈的龍頭產(chǎn)業(yè),這個(gè)方面只有房地產(chǎn)可以媲美。
但同時(shí),汽車(chē)產(chǎn)業(yè)鏈?zhǔn)且粋€(gè)低效率、變化慢的產(chǎn)業(yè)。汽車(chē)一直以來(lái)就是四個(gè)輪子、一個(gè)方向盤(pán)、兩排沙發(fā)(李書(shū)福語(yǔ))。這么一個(gè)昂貴的東西,圍繞車(chē)產(chǎn)生的數(shù)據(jù)卻少的可憐,行業(yè)產(chǎn)業(yè)鏈之間幾無(wú)任何數(shù)據(jù)傳遞。
我們?cè)谶@里狂野地想象一番,如果將汽車(chē)全面數(shù)字化,都大數(shù)據(jù)了,會(huì)產(chǎn)生什么結(jié)果?
有些人說(shuō),汽車(chē)數(shù)字化,不就是加個(gè)MBB模塊嗎?不,這太小兒科了。在我理想中,數(shù)字化意味著汽車(chē)可以隨時(shí)聯(lián)上互聯(lián)網(wǎng),意味著汽車(chē)是一個(gè)大型計(jì)算系統(tǒng)加上傳統(tǒng)的輪子、方向盤(pán)和沙發(fā),意味著可以數(shù)字化導(dǎo)航、自動(dòng)駕駛,意味著你和汽車(chē)相關(guān)的每一個(gè)行動(dòng)都數(shù)字化,包括每一次維修、每一次駕駛路線、每一次事故的錄像、每一天汽車(chē)關(guān)鍵部件的狀態(tài),甚至你的每一個(gè)駕駛習(xí)慣(如每一次的剎車(chē)和加速)都記錄在案。這樣,你的車(chē)每月甚至每周都可能產(chǎn)生T比特的數(shù)據(jù)。
好了,我們假設(shè)這些數(shù)據(jù)都可以存儲(chǔ)并分享給相關(guān)的政府、行業(yè)和企業(yè)。這里不討論隱私問(wèn)題帶來(lái)的影響,假設(shè)在隱私保護(hù)的前提下,數(shù)據(jù)可以自由分享。
那么,保險(xiǎn)公司會(huì)怎么做呢?保險(xiǎn)公司把你的所有數(shù)據(jù)拿過(guò)去建模分析,發(fā)現(xiàn)幾個(gè)重要的事實(shí):一是你開(kāi)車(chē)主要只是上下班,南山到坂田這條線路是非繁華路線,紅綠燈很少,這條路線過(guò)去一年統(tǒng)計(jì)的事故率很低;你的車(chē)況(車(chē)的使用年限、車(chē)型)好,此車(chē)型在全深圳也是車(chē)禍率較低;甚至統(tǒng)計(jì)你的駕駛習(xí)慣,加油平均,臨時(shí)剎車(chē)少,超車(chē)少,和周?chē)?chē)保持了應(yīng)有的車(chē)距,駕駛習(xí)慣好。最后結(jié)論是你車(chē)型好,車(chē)況好,駕駛習(xí)慣好,常走的線路事故率低,過(guò)去一年也沒(méi)有出過(guò)車(chē)禍,因此可以給予更大幅度的優(yōu)惠折扣。這樣保險(xiǎn)公司就完全重構(gòu)了它的商業(yè)模式了。在沒(méi)有大數(shù)據(jù)支撐之前,保險(xiǎn)公司只把車(chē)險(xiǎn)客戶做了簡(jiǎn)單的分類(lèi),一共分為四種客戶,第一種是連續(xù)兩年沒(méi)有出車(chē)禍的,第二種過(guò)去一年沒(méi)有出車(chē)禍,第三種過(guò)去一年出了一次車(chē)禍,第四種是過(guò)去一年出了兩次及以上車(chē)禍的,就四種類(lèi)型。這種簡(jiǎn)單粗暴的分類(lèi),就好像女人找老公,僅把男人分為沒(méi)有結(jié)過(guò)婚的、結(jié)過(guò)一次婚的、結(jié)過(guò)二次婚的、結(jié)過(guò)三次及以上婚的四種男人,就敢嫁人一樣。在大數(shù)據(jù)的支持下,保險(xiǎn)公司可以真正以客戶為中心,把客戶分為成千上萬(wàn)種,每個(gè)客戶都有個(gè)性化的解決方案,這樣保險(xiǎn)公司經(jīng)營(yíng)就完全不同,對(duì)于風(fēng)險(xiǎn)低的客戶敢于大膽折扣,對(duì)于風(fēng)險(xiǎn)高的客戶報(bào)高價(jià)甚至拒絕,一般的保險(xiǎn)公司就完全難以和這樣的保險(xiǎn)公司競(jìng)爭(zhēng)了。擁有大數(shù)據(jù)并使用大數(shù)據(jù)的保險(xiǎn)公司比傳統(tǒng)公司將擁有壓倒性的競(jìng)爭(zhēng)優(yōu)勢(shì),大數(shù)據(jù)將成為保險(xiǎn)公司最核心的競(jìng)爭(zhēng)力,因?yàn)楸kU(xiǎn)就是一個(gè)基于概率評(píng)估的生意,大數(shù)據(jù)對(duì)于準(zhǔn)確評(píng)估概率毫無(wú)疑問(wèn)是最有利的武器,而且簡(jiǎn)直是量身定做的武器。
在大數(shù)據(jù)的支持下,4S店的服務(wù)也完全不同了。車(chē)況信息會(huì)定期傳遞到4S店,4S店會(huì)根據(jù)情況及時(shí)提醒車(chē)主及時(shí)保養(yǎng)和維修,特別是對(duì)于可能危及安全的問(wèn)題,在客戶同意下甚至?xí)扇∵h(yuǎn)程干預(yù)措施,同時(shí)還可以提前備貨,車(chē)主一到4S店就可以維修而不用等待。
對(duì)于駕駛者來(lái)說(shuō),不想開(kāi)車(chē)的時(shí)候,在大數(shù)據(jù)和人工智能的支持下,車(chē)輛可以自動(dòng)駕駛,并且對(duì)于你經(jīng)常開(kāi)的線路可以自學(xué)習(xí)自優(yōu)化。谷歌的自動(dòng)駕駛汽車(chē),為了對(duì)周?chē)h(huán)境作出預(yù)測(cè),每秒鐘要收集差不多1GB的數(shù)據(jù),沒(méi)有大數(shù)據(jù)的支持,自動(dòng)駕駛是不可想象的;在和周?chē)?chē)輛過(guò)近的時(shí)候,會(huì)及時(shí)提醒車(chē)主避讓;上下班的時(shí)候,會(huì)根據(jù)實(shí)時(shí)大數(shù)據(jù)情況,對(duì)于你經(jīng)常開(kāi)車(chē)的線路予以提醒,繞開(kāi)擁堵點(diǎn),幫你選擇最合適的線路;在出現(xiàn)緊急狀況的時(shí)候,比如爆胎,自動(dòng)駕駛系統(tǒng)將自動(dòng)接管,提高安全性(人一輩子可以難以碰到一次爆胎,人在緊急時(shí)的反應(yīng)往往是災(zāi)難性的,只會(huì)更糟);到城市中心,尋找車(chē)位是一件很麻煩的事情,但未來(lái)你可以到了商場(chǎng)門(mén)口后,讓汽車(chē)自己去找停車(chē)位,等想要回程的時(shí)候,提前通知讓汽車(chē)自己開(kāi)過(guò)來(lái)接。
車(chē)輛是城市最大最活躍的移動(dòng)物體,是擁堵的來(lái)源,也是最大的污染來(lái)源之一。數(shù)字化的車(chē)輛、大數(shù)據(jù)應(yīng)用將帶來(lái)很多的改變。紅綠燈可以自動(dòng)優(yōu)化,根據(jù)不同道路的擁堵情況自動(dòng)進(jìn)行調(diào)整,甚至在很多地方可以取消紅綠燈;城市停車(chē)場(chǎng)也可以大幅度優(yōu)化,根據(jù)大數(shù)據(jù)的情況優(yōu)化城市停車(chē)位的設(shè)計(jì),如果配合車(chē)輛的自動(dòng)駕駛功能,停車(chē)場(chǎng)可以革命性演變,可以設(shè)計(jì)專門(mén)為自動(dòng)駕駛車(chē)輛的停車(chē)樓,地下、地上樓層可以高達(dá)幾十層,停車(chē)樓層可以更矮,只要能高于車(chē)高度即可(或者把車(chē)豎起來(lái)停),這樣將對(duì)城市規(guī)劃產(chǎn)生巨大的影響;在出現(xiàn)緊急情況,如前方塌方的時(shí)候,可以第一時(shí)間通知周?chē)?chē)輛(尤其是開(kāi)往塌方道路的車(chē)輛);現(xiàn)在的燃油稅也可以發(fā)生革命性變化,可以真正根據(jù)車(chē)輛的行駛路程,甚至根據(jù)汽車(chē)的排污量來(lái)收費(fèi),排污量少的車(chē)甚至可以搞碳交易,賣(mài)排放量賣(mài)給高油耗的車(chē);政府還可以每年公布各類(lèi)車(chē)型的實(shí)際排污量、稅款、安全性等指標(biāo),鼓勵(lì)民眾買(mǎi)更節(jié)能、更安全的車(chē)。
電子商務(wù)和快遞業(yè)也可能發(fā)生巨大的變化。運(yùn)快遞的車(chē)都可以自動(dòng)駕駛,不用趕白天的擁堵的道路,晚上半夜開(kāi),在你家門(mén)口設(shè)計(jì)自動(dòng)接收箱,通過(guò)密碼開(kāi)啟自動(dòng)投遞進(jìn)去,就好像過(guò)去報(bào)童投報(bào)一樣。
這么想象下來(lái),我認(rèn)為,汽車(chē)數(shù)字化、互聯(lián)網(wǎng)化、大數(shù)據(jù)應(yīng)用、人工智能,將對(duì)汽車(chē)業(yè)及相關(guān)的長(zhǎng)長(zhǎng)的產(chǎn)業(yè)鏈產(chǎn)生難以想象的巨大變化和產(chǎn)業(yè)革命,具有無(wú)限的想象空間,可能完全被重構(gòu)。當(dāng)然,要實(shí)現(xiàn)我所描述的場(chǎng)景,估計(jì)至少50年、100年之后的事情了,估計(jì)我這輩子是看不到的。
這里,我想系統(tǒng)回顧一下工業(yè)文明的發(fā)展歷程,首先是物理世界的工業(yè)文明,典型是蒸汽機(jī)的發(fā)明,使汽車(chē)、輪船進(jìn)入生活;然后是數(shù)字世界的工業(yè)文明,就是IT技術(shù)的使用,使PC及各種電子產(chǎn)品進(jìn)入生活,以及企業(yè)數(shù)字化系統(tǒng)的建立,使沃爾瑪這樣的巨型企業(yè)產(chǎn)生成為可能;下一步就是物理世界和數(shù)字世界的融合,這也就是業(yè)界熱炒的“工業(yè)互聯(lián)網(wǎng)”、“IT 3.0”,而這里面除了數(shù)字技術(shù)在傳統(tǒng)行業(yè)的使用(這個(gè)事實(shí)上已經(jīng)在廣泛使用)、電子商務(wù)在渠道的廣泛推行,更重要的就是大數(shù)據(jù)的產(chǎn)生及挖掘、使用,使企業(yè)在管理方式、市場(chǎng)機(jī)會(huì)挖掘、產(chǎn)品設(shè)計(jì)、營(yíng)銷(xiāo)、服務(wù)、商業(yè)模式等發(fā)生巨大的變化,這種巨大的變化帶來(lái)了很多行業(yè)的革命性變局,也就是顛覆與改造。這種變化在所謂的低效率的大行業(yè)將最為明顯與直接。這些所謂的的低效率大行業(yè),就是壟斷特征明顯、產(chǎn)業(yè)規(guī)模大、產(chǎn)業(yè)鏈長(zhǎng)、歷史悠久但長(zhǎng)時(shí)間變化少、IT應(yīng)用水平低的行業(yè),如汽車(chē)、金融、保險(xiǎn)、醫(yī)療等。
在這個(gè)章節(jié)的最后,我想總結(jié)一下自己對(duì)大數(shù)據(jù)的看法。
第一,大數(shù)據(jù)使企業(yè)真正有能力從以自我為中心改變?yōu)橐钥蛻魹橹行?。企業(yè)是為客戶而生,目的是為股東獲得利潤(rùn)。只有服務(wù)好客戶,才能獲得利潤(rùn)。但過(guò)去,很多企業(yè)是沒(méi)有能力做到以客戶為中心的,原因就是相應(yīng)客戶的信息量不大,挖掘不夠,系統(tǒng)也不支持,目前的保險(xiǎn)業(yè)就是一個(gè)典型。大數(shù)據(jù)的使用能夠使對(duì)企業(yè)的經(jīng)營(yíng)對(duì)象從客戶的粗略歸納(就是所謂提煉歸納的“客戶群”)還原成一個(gè)個(gè)活生生的客戶,這樣經(jīng)營(yíng)就有針對(duì)性,對(duì)客戶的服務(wù)就更好,投資效率就更高。
第二,大數(shù)據(jù)一定程度上將顛覆了企業(yè)的傳統(tǒng)管理方式?,F(xiàn)代企業(yè)的管理方式是來(lái)源于對(duì)軍隊(duì)的模仿,依賴于層層級(jí)級(jí)的組織和嚴(yán)格的流程,依賴信息的層層匯集、收斂來(lái)制定正確的決策,再通過(guò)決策在組織的傳遞與分解,以及流程的規(guī)范,確保決策得到貫徹,確保每一次經(jīng)營(yíng)活動(dòng)都有質(zhì)量保證,也確保一定程度上對(duì)風(fēng)險(xiǎn)的規(guī)避。過(guò)去這是一種有用而笨拙的方式。在大數(shù)據(jù)時(shí)代,我們可能重構(gòu)企業(yè)的管理方式,通過(guò)大數(shù)據(jù)的分析與挖掘,大量的業(yè)務(wù)本身就可以自決策,不必要依靠膨大的組織和復(fù)雜的流程。大家都是基于大數(shù)據(jù)來(lái)決策,都是依賴于既定的規(guī)則來(lái)決策,是高高在上的CEO決策,還是一線人員決策,本身并無(wú)大的區(qū)別,那么企業(yè)是否還需要如此多層級(jí)的組織和復(fù)雜的流程呢?
第三,大數(shù)據(jù)另外一個(gè)重大的作用是改變了商業(yè)邏輯,提供了從其他視角直達(dá)答案的可能性?,F(xiàn)在人的思考或者是企業(yè)的決策,事實(shí)上都是一種邏輯的力量在主導(dǎo)起作用。我們?nèi)フ{(diào)研,去收集數(shù)據(jù),去進(jìn)行歸納總結(jié),最后形成自己的推斷和決策意見(jiàn),這是一個(gè)觀察、思考、推理、決策的商業(yè)邏輯過(guò)程。人和組織的邏輯形成是需要大量的學(xué)習(xí)、培訓(xùn)與實(shí)踐,代價(jià)是非常巨大的。但是否這是唯一的道路呢?大數(shù)據(jù)給了我們其他的選擇,就是利用數(shù)據(jù)的力量,直接獲得答案。就好像我們學(xué)習(xí)數(shù)學(xué),小時(shí)候?qū)W九九乘法表,中學(xué)學(xué)幾何,大學(xué)還學(xué)微積分,碰到一道難題,我們是利用了多年學(xué)習(xí)沉淀的經(jīng)驗(yàn)來(lái)努力求解,但我們還有一種方法,在網(wǎng)上直接搜索是不是有這樣的題目,如果有,直接抄答案就好了。很多人就會(huì)批評(píng)說(shuō),這是抄襲,是作弊。但我們?yōu)槭裁匆獙W(xué)習(xí)啊?不就是為了解決問(wèn)題嘛。如果我任何時(shí)候都可以搜索到答案,都可以用最省力的方法找到最佳答案,這樣的搜索難道不可以是一條光明大道嗎?換句話說(shuō),為了得到“是什么”,我們不一定要理解“為什么”。我們不是否定邏輯的力量,但是至少我們有一種新的巨大力量可以依賴,這就是未來(lái)大數(shù)據(jù)的力量。
第四,通過(guò)大數(shù)據(jù),我們可能有全新的視角來(lái)發(fā)現(xiàn)新的商業(yè)機(jī)會(huì)和重構(gòu)新的商業(yè)模式。我們現(xiàn)在看這個(gè)世界,比如分析家中食品腐敗,主要就是依賴于我們的眼睛再加上我們的經(jīng)驗(yàn),但如果我們有一臺(tái)顯微鏡,我們一下就看到壞細(xì)菌,那么分析起來(lái)完全就不一樣了。大數(shù)據(jù)就是我們的顯微鏡,它可以讓我們從全新視角來(lái)發(fā)現(xiàn)新的商業(yè)機(jī)會(huì),并可能重構(gòu)商業(yè)模型。我們的產(chǎn)品設(shè)計(jì)可能不一樣了,很多事情不用猜了,客戶的習(xí)慣和偏好一目了然,我們的設(shè)計(jì)就能輕易命中客戶的心窩;我們的營(yíng)銷(xiāo)也完全不同了,我們知道客戶喜歡什么、討厭什么,更有針對(duì)性。特別是顯微鏡再加上廣角鏡,我們就有更多全新的視野了。這個(gè)廣角鏡就是跨行業(yè)的數(shù)據(jù)流動(dòng),使我們過(guò)去看不到的東西都能看到了,比如前面所述的汽車(chē)案例,開(kāi)車(chē)是開(kāi)車(chē),保險(xiǎn)是保險(xiǎn),本來(lái)不相關(guān),但當(dāng)我們把開(kāi)車(chē)的大數(shù)據(jù)傳遞到保險(xiǎn)公司,那整個(gè)保險(xiǎn)公司的商業(yè)模式就全變了,完全重構(gòu)了。
最后一點(diǎn),我想談的是大數(shù)據(jù)發(fā)展對(duì)IT本身技術(shù)架構(gòu)的革命性影響。大數(shù)據(jù)的根基是IT系統(tǒng)。我們現(xiàn)代企業(yè)的IT系統(tǒng)基本上是建立在IOE(IBM小型機(jī)、Oracle數(shù)據(jù)庫(kù)、EMC存儲(chǔ))+Cisco模型基礎(chǔ)上的,這樣的模型是Scale-UP型的架構(gòu),在解決既定模型下一定數(shù)據(jù)量的業(yè)務(wù)流程是適配的,但如果是大數(shù)據(jù)時(shí)代,很快會(huì)面臨成本、技術(shù)和商業(yè)模式的問(wèn)題,大數(shù)據(jù)對(duì)IT的需求很快就會(huì)超越了現(xiàn)有廠商架構(gòu)的技術(shù)頂點(diǎn),超大數(shù)據(jù)增長(zhǎng)將帶來(lái)IT支出增長(zhǎng)之間的線性關(guān)系,使企業(yè)難以承受。因此,目前在行業(yè)中提出的去IOE趨勢(shì),利用Scale-out架構(gòu)+開(kāi)源軟件對(duì)Scale-up架構(gòu)+私有軟件的取代,本質(zhì)是大數(shù)據(jù)業(yè)務(wù)模型所帶來(lái)的,也就是說(shuō)大數(shù)據(jù)將驅(qū)動(dòng)IT產(chǎn)業(yè)新一輪的架構(gòu)性變革。去IOE潮流中的所謂國(guó)家安全因素,完全是次要的。
所以,美國(guó)人說(shuō),大數(shù)據(jù)是資源,和大油田、大煤礦一樣,可以源源不斷挖出大財(cái)富。而且和一般資源不一樣,它是可再生的,是越挖越多、越挖越值錢(qián)的,這是反自然規(guī)律的。對(duì)企業(yè)如此,對(duì)行業(yè)、對(duì)國(guó)家也是這樣,對(duì)人同樣如此。這樣的東西誰(shuí)不喜歡呢?因此,大數(shù)據(jù)這么熱門(mén),是完全有道理的。
大數(shù)據(jù)分析文章篇3:一篇文章讀懂大數(shù)據(jù)思維
真正的革命并不在于分析數(shù)據(jù)的機(jī)器,而在于數(shù)據(jù)本身和我們?nèi)绾芜\(yùn)用數(shù)據(jù)。將大規(guī)模的數(shù)據(jù)與運(yùn)用融合一起,將會(huì)顛覆很多我們?cè)瓉?lái)的思維。大數(shù)據(jù)思維原理到底是什么?筆者概括為10項(xiàng)原理。
一、數(shù)據(jù)核心原理:從“流程”核心轉(zhuǎn)變?yōu)?ldquo;數(shù)據(jù)”核心
大數(shù)據(jù)時(shí)代,計(jì)算模式也發(fā)生了轉(zhuǎn)變,從“流程”核心轉(zhuǎn)變?yōu)?ldquo;數(shù)據(jù)”核心。Hadoop體系的分布式計(jì)算框架已經(jīng)是“數(shù)據(jù)”為核心的范式。非結(jié)構(gòu)化數(shù)據(jù)及分析需求,將改變IT系統(tǒng)的升級(jí)方式:從簡(jiǎn)單增量到架構(gòu)變化。大數(shù)據(jù)下的新思維——計(jì)算模式的轉(zhuǎn)變。
例如:IBM將使用以數(shù)據(jù)為中心的設(shè)計(jì),目的是降低在超級(jí)計(jì)算機(jī)之間進(jìn)行大量數(shù)據(jù)交換的必要性。大數(shù)據(jù)下,云計(jì)算找到了破繭重生的機(jī)會(huì),在存儲(chǔ)和計(jì)算上都體現(xiàn)了數(shù)據(jù)為核心的理念。
大數(shù)據(jù)和云計(jì)算的關(guān)系:云計(jì)算為大數(shù)據(jù)提供了有力的工具和途徑,大數(shù)據(jù)為云計(jì)算提供了很有價(jià)值的用武之地。而大數(shù)據(jù)比云計(jì)算更為落地,可有效利用已大量建設(shè)的云計(jì)算資源,最后加以利用。
科學(xué)進(jìn)步越來(lái)越多地由數(shù)據(jù)來(lái)推動(dòng),海量數(shù)據(jù)給數(shù)據(jù)分析既帶來(lái)了機(jī)遇,也構(gòu)成了新的挑戰(zhàn)。大數(shù)據(jù)往往是利用眾多技術(shù)和方法,綜合源自多個(gè)渠道、不同時(shí)間的信息而獲得的。為了應(yīng)對(duì)大數(shù)據(jù)帶來(lái)的挑戰(zhàn),我們需要新的統(tǒng)計(jì)思路和計(jì)算方法。
說(shuō)明:用數(shù)據(jù)核心思維方式思考問(wèn)題,解決問(wèn)題。以數(shù)據(jù)為核心,反映了當(dāng)下IT產(chǎn)業(yè)的變革,數(shù)據(jù)成為人工智能的基礎(chǔ),也成為智能化的基礎(chǔ),數(shù)據(jù)比流程更重要,數(shù)據(jù)庫(kù)、記錄數(shù)據(jù)庫(kù),都可開(kāi)發(fā)出深層次信息。云計(jì)算機(jī)可以從數(shù)據(jù)庫(kù)、記錄數(shù)據(jù)庫(kù)中搜索出你是誰(shuí),你需要什么,從而推薦給你需要的信息。
二、數(shù)據(jù)價(jià)值原理:由功能是價(jià)值轉(zhuǎn)變?yōu)閿?shù)據(jù)是價(jià)值
大數(shù)據(jù)真正有意思的是數(shù)據(jù)變得在線了,這個(gè)恰恰是互聯(lián)網(wǎng)的特點(diǎn)。非互聯(lián)網(wǎng)時(shí)期的產(chǎn)品,功能一定是它的價(jià)值,今天互聯(lián)網(wǎng)的產(chǎn)品,數(shù)據(jù)一定是它的價(jià)值。
例如:大數(shù)據(jù)的真正價(jià)值在于創(chuàng)造,在于填補(bǔ)無(wú)數(shù)個(gè)還未實(shí)現(xiàn)過(guò)的空白。有人把數(shù)據(jù)比喻為蘊(yùn)藏能量的煤礦,煤炭按照性質(zhì)有焦煤、無(wú)煙煤、肥煤、貧煤等分類(lèi),而露天煤礦、深山煤礦的挖掘成本又不一樣。
與此類(lèi)似,大數(shù)據(jù)并不在“大”,而在于“有用”,價(jià)值含量、挖掘成本比數(shù)量更為重要。不管大數(shù)據(jù)的核心價(jià)值是不是預(yù)測(cè),但是基于大數(shù)據(jù)形成決策的模式已經(jīng)為不少的企業(yè)帶來(lái)了盈利和聲譽(yù)。
數(shù)據(jù)能告訴我們,每一個(gè)客戶的消費(fèi)傾向,他們想要什么,喜歡什么,每個(gè)人的需求有哪些區(qū)別,哪些又可以被集合到一起來(lái)進(jìn)行分類(lèi)。大數(shù)據(jù)是數(shù)據(jù)數(shù)量上的增加,以至于我們能夠?qū)崿F(xiàn)從量變到質(zhì)變的過(guò)程。
舉例來(lái)說(shuō),這里有一張照片,照片里的人在騎馬,這張照片每一分鐘,每一秒都要拍一張,但隨著處理速度越來(lái)越快,從1分鐘一張到1秒鐘1張,突然到1秒鐘10張后,就產(chǎn)生了電影。當(dāng)數(shù)量的增長(zhǎng)實(shí)現(xiàn)質(zhì)變時(shí),就從照片變成了一部電影。
美國(guó)有一家創(chuàng)新企業(yè)Decide.com,它可以幫助人們做購(gòu)買(mǎi)決策,告訴消費(fèi)者什么時(shí)候買(mǎi)什么產(chǎn)品,什么時(shí)候買(mǎi)最便宜,預(yù)測(cè)產(chǎn)品的價(jià)格趨勢(shì),這家公司背后的驅(qū)動(dòng)力就是大數(shù)據(jù)。他們?cè)谌蚋鞔缶W(wǎng)站上搜集數(shù)以十億計(jì)的數(shù)據(jù),然后幫助數(shù)以十萬(wàn)計(jì)的用戶省錢(qián),為他們的采購(gòu)找到最好的時(shí)間,降低交易成本,為終端的消費(fèi)者帶去更多價(jià)值。
在這類(lèi)模式下,盡管一些零售商的利潤(rùn)會(huì)進(jìn)一步受擠壓,但從商業(yè)本質(zhì)上來(lái)講,可以把錢(qián)更多地放回到消費(fèi)者的口袋里,讓購(gòu)物變得更理性,這是依靠大數(shù)據(jù)催生出的一項(xiàng)全新產(chǎn)業(yè)。這家為數(shù)以十萬(wàn)計(jì)的客戶省錢(qián)的公司,在幾個(gè)星期前,被eBay以高價(jià)收購(gòu)。
再舉一個(gè)例子,SWIFT是全球最大的支付平臺(tái),在該平臺(tái)上的每一筆交易都可以進(jìn)行大數(shù)據(jù)的分析,他們可以預(yù)測(cè)一個(gè)經(jīng)濟(jì)體的健康性和增長(zhǎng)性。比如,該公司現(xiàn)在為全球性客戶提供經(jīng)濟(jì)指數(shù),這又是一個(gè)大數(shù)據(jù)服務(wù)。
定制化服務(wù)的關(guān)鍵是數(shù)據(jù)?!洞髷?shù)據(jù)時(shí)代》的作者維克托·邁爾·舍恩伯格認(rèn)為,大量的數(shù)據(jù)能夠讓傳統(tǒng)行業(yè)更好地了解客戶需求,提供個(gè)性化的服務(wù)。
說(shuō)明:用數(shù)據(jù)價(jià)值思維方式思考問(wèn)題,解決問(wèn)題。信息總量的變化導(dǎo)致了信息形態(tài)的變化,量變引發(fā)了質(zhì)變,最先經(jīng)歷信息爆炸的學(xué)科,如天文學(xué)和基因?qū)W,創(chuàng)造出了“大數(shù)據(jù)”這個(gè)概念。
如今,這個(gè)概念幾乎應(yīng)用到了所有人類(lèi)致力于發(fā)展的領(lǐng)域中。從功能為價(jià)值轉(zhuǎn)變?yōu)閿?shù)據(jù)為價(jià)值,說(shuō)明數(shù)據(jù)和大數(shù)據(jù)的價(jià)值在擴(kuò)大,數(shù)據(jù)為“王”的時(shí)代出現(xiàn)了。數(shù)據(jù)被解釋是信息,信息常識(shí)化是知識(shí),所以說(shuō)數(shù)據(jù)解釋、數(shù)據(jù)分析能產(chǎn)生價(jià)值。
三、全樣本原理原理:從抽樣轉(zhuǎn)變?yōu)樾枰繑?shù)據(jù)樣本
需要全部數(shù)據(jù)樣本而不是抽樣,你不知道的事情比你知道的事情更重要,但如果現(xiàn)在數(shù)據(jù)足夠多,它會(huì)讓人能夠看得見(jiàn)、摸得著規(guī)律。數(shù)據(jù)這么大、這么多,所以人們覺(jué)得有足夠的能力把握未來(lái),對(duì)不確定狀態(tài)的一種判斷,從而做出自己的決定。
這些東西我們聽(tīng)起來(lái)都是非常原始的,但是實(shí)際上背后的思維方式,和我們今天所講的大數(shù)據(jù)是非常像的。
舉例:在大數(shù)據(jù)時(shí)代,無(wú)論是商家還是信息的搜集者,會(huì)比我們自己更知道你可能會(huì)想干什么。現(xiàn)在的數(shù)據(jù)還沒(méi)有被真正挖掘,如果真正挖掘的話,通過(guò)信用卡消費(fèi)的記錄,可以成功預(yù)測(cè)未來(lái)5年內(nèi)的情況。
統(tǒng)計(jì)學(xué)里頭最基本的一個(gè)概念就是,全部樣本才能找出規(guī)律。為什么能夠找出行為規(guī)律?一個(gè)更深層的概念是人和人是一樣的,如果是一個(gè)人特例出來(lái),可能很有個(gè)性,但當(dāng)人口樣本數(shù)量足夠大時(shí),就會(huì)發(fā)現(xiàn)其實(shí)每個(gè)人都是一模一樣的。
說(shuō)明:用全數(shù)據(jù)樣本思維方式思考問(wèn)題,解決問(wèn)題。從抽樣中得到的結(jié)論總是有水分的,而全部樣本中得到的結(jié)論水分就很少,大數(shù)據(jù)越大,真實(shí)性也就越大,因?yàn)榇髷?shù)據(jù)包含了全部的信息。
四、關(guān)注效率原理:由關(guān)注精確度轉(zhuǎn)變?yōu)殛P(guān)注效率
關(guān)注效率而不是精確度,大數(shù)據(jù)標(biāo)志著人類(lèi)在尋求量化和認(rèn)識(shí)世界的道路上前進(jìn)了一大步,過(guò)去不可計(jì)量、存儲(chǔ)、分析和共享的很多東西都被數(shù)據(jù)化了,擁有大量的數(shù)據(jù)和更多不那么精確的數(shù)據(jù)為我們理解世界打開(kāi)了一扇新的大門(mén)。
大數(shù)據(jù)能提高生產(chǎn)效率和銷(xiāo)售效率,原因是大數(shù)據(jù)能夠讓我們知道市場(chǎng)的需要,人的消費(fèi)需要。大數(shù)據(jù)讓企業(yè)的決策更科學(xué),由關(guān)注精確度轉(zhuǎn)變?yōu)殛P(guān)注效率的提高,大數(shù)據(jù)分析能提高企業(yè)的效率。
例如:在互聯(lián)網(wǎng)大數(shù)據(jù)時(shí)代,企業(yè)產(chǎn)品迭代的速度在加快。三星、小米手機(jī)制造商半年就推出一代新智能手機(jī)。利用互聯(lián)網(wǎng)、大數(shù)據(jù)提高企業(yè)效率的趨勢(shì)下,快速就是效率、預(yù)測(cè)就是效率、預(yù)見(jiàn)就是效率、變革就是效率、創(chuàng)新就是效率、應(yīng)用就是效率。
競(jìng)爭(zhēng)是企業(yè)的動(dòng)力,而效率是企業(yè)的生命,效率低與效率高是衡量企來(lái)成敗的關(guān)鍵。一般來(lái)講,投入與產(chǎn)出比是效率,追求高效率也就是追求高價(jià)值。手工、機(jī)器、自動(dòng)機(jī)器、智能機(jī)器之間效率是不同的,智能機(jī)器效率更高,已能代替人的思維勞動(dòng)。智能機(jī)器核心是大數(shù)據(jù)制動(dòng),而大數(shù)據(jù)制動(dòng)的速度更快。
在快速變化的市場(chǎng),快速預(yù)測(cè)、快速?zèng)Q策、快速創(chuàng)新、快速定制、快速生產(chǎn)、快速上市成為企業(yè)行動(dòng)的準(zhǔn)則,也就是說(shuō),速度就是價(jià)值,效率就是價(jià)值,而這一切離不開(kāi)大數(shù)據(jù)思維。
說(shuō)明:用關(guān)注效率思維方式思考問(wèn)題,解決問(wèn)題。大數(shù)據(jù)思維有點(diǎn)像混沌思維,確定與不確定交織在一起,過(guò)去那種一元思維結(jié)果,已被二元思維結(jié)果取代。
過(guò)去尋求精確度,現(xiàn)在尋求高效率;過(guò)去尋求因果性,現(xiàn)在尋求相關(guān)性;過(guò)去尋找確定性,現(xiàn)在尋找概率性,對(duì)不精確的數(shù)據(jù)結(jié)果已能容忍。只要大數(shù)據(jù)分析指出可能性,就會(huì)有相應(yīng)的結(jié)果,從而為企業(yè)快速?zèng)Q策、快速動(dòng)作、創(chuàng)占先機(jī)提高了效率。
五、關(guān)注相關(guān)性原理:由因果關(guān)系轉(zhuǎn)變?yōu)殛P(guān)注相關(guān)性
關(guān)注相關(guān)性而不是因果關(guān)系,社會(huì)需要放棄它對(duì)因果關(guān)系的渴求,而僅需關(guān)注相關(guān)關(guān)系,也就是說(shuō)只需要知道是什么,而不需要知道為什么。這就推翻了自古以來(lái)的慣例,而我們做決定和理解現(xiàn)實(shí)的最基本方式也將受到挑戰(zhàn)。
例如:大數(shù)據(jù)思維一個(gè)最突出的特點(diǎn),就是從傳統(tǒng)的因果思維轉(zhuǎn)向相關(guān)思維,傳統(tǒng)的因果思維是說(shuō)我一定要找到一個(gè)原因,推出一個(gè)結(jié)果來(lái)。
而大數(shù)據(jù)沒(méi)有必要找到原因,不需要科學(xué)的手段來(lái)證明這個(gè)事件和那個(gè)事件之間有一個(gè)必然,先后關(guān)聯(lián)發(fā)生的一個(gè)因果規(guī)律。它只需要知道,出現(xiàn)這種跡象的時(shí)候,我就按照一般的情況,這個(gè)數(shù)據(jù)統(tǒng)計(jì)的高概率顯示它會(huì)有相應(yīng)的結(jié)果,那么我只要發(fā)現(xiàn)這種跡象的時(shí)候,我就可以去做一個(gè)決策,我該怎么做。
這是和以前的思維方式很不一樣,老實(shí)說(shuō),它是一種有點(diǎn)反科學(xué)的思維,科學(xué)要求實(shí)證,要求找到準(zhǔn)確的因果關(guān)系。
在這個(gè)不確定的時(shí)代里面,等我們?nèi)フ业綔?zhǔn)確的因果關(guān)系,再去辦事的時(shí)候,這個(gè)事情早已經(jīng)不值得辦了。所以“大數(shù)據(jù)”時(shí)代的思維有點(diǎn)像回歸了工業(yè)社會(huì)的這種機(jī)械思維——機(jī)械思維就是說(shuō)我按那個(gè)按鈕,一定會(huì)出現(xiàn)相應(yīng)的結(jié)果,是這樣狀態(tài)。
而農(nóng)業(yè)社會(huì)往前推,不需要找到中間非常緊密的、明確的因果關(guān)系,而只需要找到相關(guān)關(guān)系,只需要找到跡象就可以了。社會(huì)因此放棄了尋找因果關(guān)系的傳統(tǒng)偏好,開(kāi)始挖掘相關(guān)關(guān)系的好處。
例如:美國(guó)人開(kāi)發(fā)一款“個(gè)性化分析報(bào)告自動(dòng)可視化程序”軟件從網(wǎng)上挖掘數(shù)據(jù)信息,這款數(shù)據(jù)挖掘軟件將自動(dòng)從各種數(shù)據(jù)中提取重要信息,然后進(jìn)行分析,并把此信息與以前的數(shù)據(jù)關(guān)聯(lián)起來(lái),分析出有用的信息。
非法在屋內(nèi)打隔斷的建筑物著火的可能性比其他建筑物高很多。紐約市每年接到2.5萬(wàn)宗有關(guān)房屋住得過(guò)于擁擠的投訴,但市里只有200名處理投訴的巡視員,市長(zhǎng)辦公室一個(gè)分析專家小組覺(jué)得大數(shù)據(jù)可以幫助解決這一需求與資源的落差。
該小組建立了一個(gè)市內(nèi)全部90萬(wàn)座建筑物的數(shù)據(jù)庫(kù),并在其中加入市里19個(gè)部門(mén)所收集到的數(shù)據(jù):欠稅扣押記錄、水電使用異常、繳費(fèi)拖欠、服務(wù)切斷、救護(hù)車(chē)使用、當(dāng)?shù)胤缸锫?、鼠患投訴,諸如此類(lèi)。
接下來(lái),他們將這一數(shù)據(jù)庫(kù)與過(guò)去5年中按嚴(yán)重程度排列的建筑物著火記錄進(jìn)行比較,希望找出相關(guān)性。果然,建筑物類(lèi)型和建造年份是與火災(zāi)相關(guān)的因素。不過(guò),一個(gè)沒(méi)怎么預(yù)料到的結(jié)果是,獲得外磚墻施工許可的建筑物與較低的嚴(yán)重火災(zāi)發(fā)生率之間存在相關(guān)性。
利用所有這些數(shù)據(jù),該小組建立了一個(gè)可以幫助他們確定哪些住房擁擠投訴需要緊急處理的系統(tǒng)。他們所記錄的建筑物的各種特征數(shù)據(jù)都不是導(dǎo)致火災(zāi)的原因,但這些數(shù)據(jù)與火災(zāi)隱患的增加或降低存在相關(guān)性。
這種知識(shí)被證明是極具價(jià)值的:過(guò)去房屋巡視員出現(xiàn)場(chǎng)時(shí)簽發(fā)房屋騰空令的比例只有13%,在采用新辦法之后,這個(gè)比例上升到了70%——效率大大提高了。
全世界的商界人士都在高呼大數(shù)據(jù)時(shí)代來(lái)臨的優(yōu)勢(shì):一家超市如何從一個(gè)17歲女孩的購(gòu)物清單中,發(fā)現(xiàn)了她已懷孕的事實(shí);或者將啤酒與尿不濕放在一起銷(xiāo)售,神奇地提高了雙方的銷(xiāo)售額。大數(shù)據(jù)透露出來(lái)的信息有時(shí)確實(shí)會(huì)起顛覆。
比如,騰訊一項(xiàng)針對(duì)社交網(wǎng)絡(luò)的統(tǒng)計(jì)顯示,愛(ài)看家庭劇的男人是女性的兩倍還多;最關(guān)心金價(jià)的是中國(guó)大媽,但緊隨其后的卻是90后。而在過(guò)去一年,支付寶中無(wú)線支付比例排名前十的竟然全部在青海、西藏和內(nèi)蒙古地區(qū)。
說(shuō)明:用關(guān)注相關(guān)性思維方式來(lái)思考問(wèn)題,解決問(wèn)題。尋找原因是一種現(xiàn)代社會(huì)的一神論,大數(shù)據(jù)推翻了這個(gè)論斷。
過(guò)去尋找原因的信念正在被“更好”的相關(guān)性所取代。當(dāng)世界由探求因果關(guān)系變成挖掘相關(guān)關(guān)系,我們?cè)鯓硬拍芗炔粨p壞建立在因果推理基礎(chǔ)之上的社會(huì)繁榮和人類(lèi)進(jìn)步的基石,又取得實(shí)際的進(jìn)步呢?這是值得思考的問(wèn)題。
解釋:轉(zhuǎn)向相關(guān)性,不是不要因果關(guān)系,因果關(guān)系還是基礎(chǔ),科學(xué)的基石還是要的。只是在高速信息化的時(shí)代,為了得到即時(shí)信息,實(shí)時(shí)預(yù)測(cè),在快速的大數(shù)據(jù)分析技術(shù)下,尋找到相關(guān)性信息,就可預(yù)測(cè)用戶的行為,為企業(yè)快速?zèng)Q策提供提前量。
比如預(yù)警技術(shù),只有提前幾十秒察覺(jué),防御系統(tǒng)才能起作用。比如,雷達(dá)顯示有個(gè)提前量,如果沒(méi)有這個(gè)預(yù)知的提前量,雷達(dá)的作用也就沒(méi)有了,相關(guān)性也是這個(gè)原理。比如,相對(duì)論與量子論的爭(zhēng)論也能說(shuō)明問(wèn)題,一個(gè)說(shuō)上帝不擲骰子,一個(gè)說(shuō)上帝擲骰子,爭(zhēng)論幾十年,最后承認(rèn)兩個(gè)都存在,而且量子論取得更大的發(fā)展——一個(gè)適用于宇宙尺度,一個(gè)適用于原子尺度。
看過(guò)“大數(shù)據(jù)分析文章”的人還看了:
1.大數(shù)據(jù)時(shí)代讀書(shū)心得體會(huì)
4.大數(shù)據(jù)基礎(chǔ)知識(shí) 大數(shù)據(jù)意義價(jià)值
5.讀書(shū)《大數(shù)據(jù)時(shí)代》心得體會(huì)演講稿3篇