Excel數(shù)據(jù)挖掘和統(tǒng)計分析是怎樣的
Excel數(shù)據(jù)挖掘和統(tǒng)計分析是怎樣的
很多人問數(shù)據(jù)挖掘和統(tǒng)計分析的不同之處是什么?相同之處是什么?這樣的問題,其實數(shù)據(jù)挖掘和統(tǒng)計分析的基礎都是數(shù)學理論。以下是學習啦小編為您帶來的關于數(shù)據(jù)挖掘和統(tǒng)計分析,希望對您有所幫助。
Excel數(shù)據(jù)挖掘和統(tǒng)計分析
數(shù)據(jù)挖掘是直接從龐大的數(shù)據(jù)中挖掘,而統(tǒng)計分析則是從龐大的數(shù)據(jù)(總體)中,用隨機抽樣的方法抽取一部分數(shù)據(jù)(樣本)。通過分析樣本數(shù)據(jù)來推測總體特性(平均、比例、標準偏差等)的統(tǒng)計方法,被稱為推測統(tǒng)計學。另外,統(tǒng)計學中還有記述統(tǒng)計學,它足一種能夠正確記述并把握獲得的數(shù)據(jù)特性的方法。甚至可以說,記述統(tǒng)計學+其他=數(shù)據(jù)挖掘。
數(shù)據(jù)挖掘的目的是從數(shù)據(jù)中挖掘有效信息。為了實現(xiàn)這個目,可以使用神經(jīng)網(wǎng)絡、購物籃分析以及“多變量分析”的數(shù)量化理論、判別分析、回歸分析、邏輯回歸分析、聚類分析、主成分分析、因子分析、對應分析(雙尺度祛)、典型相關分析、聯(lián)合分析等方法。多變量分析是將相互關聯(lián)的多變量的數(shù)據(jù)特征或趨勢,用統(tǒng)計學方法進行分析的方法的總稱。多變量分析是數(shù)據(jù)挖掘的重要方法之一,包括各種統(tǒng)計分析方法(如下圖):
如果單純考慮數(shù)量化理論或者回歸分析等統(tǒng)計分析方法就會發(fā)現(xiàn),雖然分析過程具有很強的數(shù)學性,然而操作卻只不過是“計算”而已。為了實現(xiàn)數(shù)據(jù)挖掘的目的,把統(tǒng)計學方法單獨或者組合使用,是非常有效的數(shù)據(jù)分析方法。例如,回歸分析在“預測”和“因子分析”時十分有效。另外,極力推薦把聚類分析和判別分析組合之后挖掘數(shù)據(jù)。
在人類基因組領域中,先通過聚類分析,例如,將總體分成5組,再按照外在基準對5組小集合進行判別分析。經(jīng)過兩個階段的分析后,再進行判別預測和因子分析。就能分別得出5組小集合的特征。同樣地,對交叉表數(shù)據(jù)實施對應分析(雙尺度祛)后再進行聚類分析,最后做模型分類。
看了數(shù)據(jù)挖掘和統(tǒng)計分析的區(qū)別和介紹后,也就體會到了數(shù)據(jù)挖掘的目的所在,不過千萬不要氣餒或喪失自信哦,因為在前面我們就已經(jīng)提到,進行數(shù)據(jù)挖掘不需要具備高深的專業(yè)知識,也提到了多變量分析是數(shù)據(jù)挖掘的重要方法。那么,“從來沒聽說過多變量分析”的人該怎么辦呢?使用Excel就能解決。只要能夠靈活使用Excel,即使沒有高深的統(tǒng)計學知識也能挖掘數(shù)據(jù)。Excel網(wǎng)站的目的是在通過介紹用Excel挖掘數(shù)據(jù)的方法,向Excel網(wǎng)友傳達數(shù)據(jù)挖掘的樂趣,而不是枯燥無味的數(shù)學概念,這也是Excel網(wǎng)站能夠得到眾多網(wǎng)友支持的重要原因所在,我們也會繼續(xù)努力,為大家?guī)砀喔酶唵魏陀腥び袃r值的內(nèi)容。
猜你喜歡:
1.淺談數(shù)據(jù)挖掘在電力企業(yè)中的應用論文