怎樣把數(shù)據(jù)挖掘應(yīng)用到工作中
學(xué)習(xí)并熟練使用前面介紹的Excel的五大功能,就可以掌握數(shù)據(jù)挖掘的基本操作,數(shù)據(jù)挖掘通常要處理大量的數(shù)據(jù),需要有方便操作的工具。以下是學(xué)習(xí)啦小編為您帶來的關(guān)于把數(shù)據(jù)挖掘應(yīng)用到工作中,希望對您有所幫助。
把數(shù)據(jù)挖掘應(yīng)用到工作中
如今,企業(yè)需要考慮投資效果,不會隨便投入大量資金。因此,我排薦使用Excel的數(shù)據(jù)挖掘工具(加載宏軟件)。根據(jù)不同的功能需求,可以在工作中靈活使用Excel的加載宏軟件、同樣可以很好地滿足數(shù)據(jù)挖掘的目的需求。
一、用數(shù)據(jù)挖掘得出假設(shè),用實驗規(guī)劃進(jìn)行檢驗
如果數(shù)據(jù)挖掘得出了假設(shè),那么能否使用數(shù)據(jù)分析方法之一的聯(lián)合分析檢驗假設(shè)呢?聯(lián)合分析是20世紀(jì)80年代在美國快速發(fā)展的市場營銷領(lǐng)域版實驗規(guī)劃法。廣告詞是“開發(fā)暢銷產(chǎn)品的概念組合”。用虛擬變量的回歸分析解析聯(lián)合分析的數(shù)據(jù)。
為了調(diào)查哪種簡易的網(wǎng)絡(luò)教育書籍最受歡迎,進(jìn)行一項問卷調(diào)查,回收井分析數(shù)據(jù).設(shè)定因子和項目,如下圖所示:
根據(jù)分析結(jié)果可知,主要因子和項目是“圖形豐富”、“有詳細(xì)的問題解答”、“大量插圖”的書籍最受歡迎。關(guān)于聯(lián)合分析Excel網(wǎng)小編將在后面文章中詳細(xì)說明。
二、學(xué)習(xí)線性代數(shù)
盲目使用工具很危險,最好預(yù)先掌握作為統(tǒng)計學(xué)基礎(chǔ)的線性代數(shù),尤其是逆矩陣和特征值,這是線性代數(shù)的兩大課題。
多重回歸分析、數(shù)量化理論I通過求解逆矩陣可以得出答案,但是根據(jù)不同數(shù)據(jù)類型,有時下需要求逆矩陣。此吋,統(tǒng)計軟件可能會輸出某些錯誤信息,所以不一定都是便利的工具。雖然經(jīng)常出現(xiàn)秩虧,但是只要掌握了線性代數(shù),就能坦然應(yīng)對。解決秩虧的方法有兩種:①使用規(guī)劃求解②使用一般逆矩陣。筆者知道S-PLUS可以求解逆矩陣,目前急需開發(fā)Excel的此項功能。
三、學(xué)習(xí)一般逆矩陣和異常值分解法
如上所述,一般逆矩陣的應(yīng)用范圍十分廣泛,現(xiàn)在非常希望普及異常值分解的方法。分解矩陣異常值的軟件,在數(shù)據(jù)挖掘中備受重視。異常值分解的函數(shù),例如,S語言(樣本版R)支持異常值分解(SvD SmsularValue DocomPosition)。對應(yīng)分析(雙尺度法)也歸結(jié)為異常值分解。因此,異常值分解的應(yīng)用范圍不斷擴(kuò)大。與一般逆矩陣相似.急需在Excel的加載宏軟件上實現(xiàn)異常值分解的功能。
上面介紹把數(shù)據(jù)挖掘應(yīng)用到工作中的相關(guān)內(nèi)容后,相信通過努力學(xué)習(xí)時間您一定能把數(shù)據(jù)挖掘應(yīng)用到企業(yè)中去的,下面簡單提下S-PLUS和R,Excel網(wǎng)小編在不知道Excel的“數(shù)據(jù)分析”和“規(guī)劃求解”功能之前,經(jīng)常使用Insighful公司開發(fā)的S-PLUS(樣本版是R)。現(xiàn)在筆者盡量使用Excel的5大功能以及加載宏軟件挖掘數(shù)據(jù),只有在特殊情況下才使用S-PLUS。因此,推薦讀者靈活運(yùn)用Excel和S-PLUS的樣本版R(R可以免費(fèi)下載),這兩個軟件可以方便地編寫各種統(tǒng)計函數(shù)。
猜你喜歡: