數(shù)據(jù)分析也好,統(tǒng)計(jì)分析也好,數(shù)據(jù)挖掘也好、商業(yè)智能也好都需要在學(xué)習(xí)的時(shí)候掌握各種分析手段和技能,特別是要掌握分析軟件工具!學(xué)習(xí)數(shù)據(jù)分析,一般是先學(xué)軟件開(kāi)始,再去應(yīng)用,再學(xué)會(huì)理論和原理!沒(méi)有軟件的方法就不去學(xué)了,因?yàn)閷W(xué)了也不能做,除非你自己會(huì)編程序。
SPSS、SAS都是用于統(tǒng)計(jì)分析,圍繞統(tǒng)計(jì)學(xué)知識(shí)的一些基本應(yīng)用,包括描述統(tǒng)計(jì),方差分析,因子分析,主成分分析,基本的回歸,分布的檢驗(yàn)等等。SPSS用于市場(chǎng)研究較多,SAS銀行金融和醫(yī)學(xué)統(tǒng)計(jì)較多,有一些難度。
R語(yǔ)言像是綜合性較強(qiáng)的一類(lèi)數(shù)據(jù)分析工具,集統(tǒng)計(jì)分析、數(shù)據(jù)挖掘,數(shù)據(jù)可視化。
展開(kāi)來(lái),講講數(shù)據(jù)分析~
這些數(shù)據(jù)分析工具的使用還是看需求,每個(gè)企業(yè)應(yīng)用的選擇和方式都不同。數(shù)據(jù)分析的概念很廣,站在IT的角度,實(shí)際應(yīng)用中可以把數(shù)據(jù)分析工具分成兩個(gè)維度:
第一維度:數(shù)據(jù)存儲(chǔ)層——數(shù)據(jù)報(bào)表層——數(shù)據(jù)分析層——數(shù)據(jù)展現(xiàn)層
第二維度:用戶(hù)級(jí)——部門(mén)級(jí)——企業(yè)級(jí)——BI級(jí)
1、數(shù)據(jù)存儲(chǔ)層
數(shù)據(jù)存儲(chǔ)設(shè)計(jì)到數(shù)據(jù)庫(kù)的概念和數(shù)據(jù)庫(kù)語(yǔ)言,這方面不一定要深鉆研,但至少要理解數(shù)據(jù)的存儲(chǔ)方式,數(shù)據(jù)的基本結(jié)構(gòu)和數(shù)據(jù)類(lèi)型。SQL查詢(xún)語(yǔ)言必不可少,精通最好??蓮某S玫膕elece查詢(xún),update修改,delete刪除,insert插入的基本結(jié)構(gòu)和讀取入手。
Access2003、Access07等,這是最基本的個(gè)人數(shù)據(jù)庫(kù),經(jīng)常用于個(gè)人或部分基本的數(shù)據(jù)存儲(chǔ);MySQL數(shù)據(jù)庫(kù),這個(gè)對(duì)于部門(mén)級(jí)或者互聯(lián)網(wǎng)的數(shù)據(jù)庫(kù)應(yīng)用是必要的,這個(gè)時(shí)候關(guān)鍵掌握數(shù)據(jù)庫(kù)的庫(kù)結(jié)構(gòu)和SQL語(yǔ)言的數(shù)據(jù)查詢(xún)能力;
SQL Server2005或更高版本,對(duì)中小企業(yè),一些大型企業(yè)也可以采用SQL Server數(shù)據(jù)庫(kù),其實(shí)這個(gè)時(shí)候本身除了數(shù)據(jù)存儲(chǔ),也包括了數(shù)據(jù)報(bào)表和數(shù)據(jù)分析了,甚至數(shù)據(jù)挖掘工具都在其中了;
DB2,Oracle數(shù)據(jù)庫(kù)都是大型數(shù)據(jù)庫(kù),主要是企業(yè)級(jí),特別是大型企業(yè)或者對(duì)數(shù)據(jù)海量存儲(chǔ)需求的就是必須的了,一般大型數(shù)據(jù)庫(kù)公司都提供非常好的數(shù)據(jù)整合應(yīng)用平臺(tái);
BI級(jí)別,實(shí)際上這個(gè)不是數(shù)據(jù)庫(kù),而是建立在前面數(shù)據(jù)庫(kù)基礎(chǔ)上的,企業(yè)級(jí)應(yīng)用的數(shù)據(jù)倉(cāng)庫(kù)。Data Warehouse,建立在DW機(jī)上的數(shù)據(jù)存儲(chǔ)基本上都是商業(yè)智能平臺(tái),整合了各種數(shù)據(jù)分析,報(bào)表、分析和展現(xiàn),BI級(jí)別的數(shù)據(jù)倉(cāng)庫(kù)結(jié)合BI產(chǎn)品也是近幾年的大趨勢(shì)。
2、報(bào)表/BI層
企業(yè)存儲(chǔ)了數(shù)據(jù)需要讀取,需要展現(xiàn),報(bào)表工具是最普遍應(yīng)用的工具,尤其是在國(guó)內(nèi)。過(guò)去傳統(tǒng)報(bào)表大多解決的是展現(xiàn)問(wèn)題,如今像帆軟報(bào)表FineReport也會(huì)和其他應(yīng)用交叉,做數(shù)據(jù)分析報(bào)表,通過(guò)接口開(kāi)放功能、填報(bào)、決策報(bào)表功能,能夠做到打通數(shù)據(jù)的進(jìn)出,涵蓋了早期商業(yè)智能的功能。
Tableau、Qlikview、FineBI這類(lèi)BI工具,可分在報(bào)表層也可分為數(shù)據(jù)展現(xiàn)層,涵蓋了數(shù)據(jù)整合、數(shù)據(jù)分析和數(shù)據(jù)展現(xiàn)。FineBI和Tableau同屬于近年來(lái)非常棒的軟件,可作為可視化數(shù)據(jù)分析軟件,可常用FineBI從數(shù)據(jù)庫(kù)中取數(shù)進(jìn)行報(bào)表和可視化分析。相對(duì)而言,可視化Tableau更優(yōu),但FineBI又有另一種身份——商業(yè)智能,所以在大數(shù)據(jù)處理方面的能力更勝一籌。
3、數(shù)據(jù)分析層
這個(gè)層其實(shí)有很多分析工具,當(dāng)然我們最常用的就是Excel。
Excel軟件,首先版本越高越好用這是肯定的;當(dāng)然對(duì)excel來(lái)講很多人只是掌握了5%Excel功能,Excel功能非常強(qiáng)大,甚至可以完成所有的統(tǒng)計(jì)分析工作!但是我也常說(shuō),有能力把Excel玩成統(tǒng)計(jì)工具不如專(zhuān)門(mén)學(xué)會(huì)統(tǒng)計(jì)軟件;
SPSS軟件:當(dāng)前版本是18,名字也改成了PASW Statistics;我從3.0開(kāi)始Dos環(huán)境下編程分析,到現(xiàn)在版本的變遷也可以看出SPSS社會(huì)科學(xué)統(tǒng)計(jì)軟件包的變化,從重視醫(yī)學(xué)、化學(xué)等開(kāi)始越來(lái)越重視商業(yè)分析,現(xiàn)在已經(jīng)成為了預(yù)測(cè)分析軟件;
SAS軟件:SAS相對(duì)SPSS其實(shí)功能更強(qiáng)大,SAS是平臺(tái)化的,EM挖掘模塊平臺(tái)整合,相對(duì)來(lái)講,SAS比較難學(xué)些,但如果掌握了SAS會(huì)更有價(jià)值,比如離散選擇模型,抽樣問(wèn)題,正交實(shí)驗(yàn)設(shè)計(jì)等還是SAS比較好用,另外,SAS的學(xué)習(xí)材料比較多,也公開(kāi),會(huì)有收獲的!
JMP分析:SAS的一個(gè)分析分支
XLstat:Excel的插件,可以完成大部分SPSS統(tǒng)計(jì)分析功能
4、表現(xiàn)層
表現(xiàn)層也叫數(shù)據(jù)可視化,以上每種工具都幾乎提供了一點(diǎn)展現(xiàn)功能。FineBI和Tableau的可視化功能上文有提過(guò)。其實(shí),近年來(lái)Excel的可視化越來(lái)越棒,配上一些插件,使用感更佳。
PPT:辦公常用,用來(lái)寫(xiě)數(shù)據(jù)分析報(bào)告;
Xmind&百度腦圖:梳理流程,幫助思考分析,展現(xiàn)數(shù)據(jù)分析的層次;
Xcelsius軟件:Dashboard制作和數(shù)據(jù)可視化報(bào)表工具,可以直接讀取數(shù)據(jù)庫(kù),在Excel里建模,互聯(lián)網(wǎng)展現(xiàn),最大特色還是可以在PPT中實(shí)現(xiàn)動(dòng)態(tài)報(bào)表。
下面詳細(xì)介紹一下7款廣泛流行的數(shù)據(jù)分析軟件平臺(tái),幫助企業(yè)實(shí)施數(shù)據(jù)收集、數(shù)據(jù)管理、數(shù)據(jù)分析、數(shù)據(jù)挖掘,使企業(yè)根據(jù)數(shù)據(jù)做出很好的決策,主要包括SPSS數(shù)據(jù)分析軟件,SAS分析軟件,Minitab軟件,Stata統(tǒng)計(jì)軟件,JMP數(shù)據(jù)探索、挖掘、分析軟件,Crystal Report報(bào)表軟件, AnyReport數(shù)據(jù)分析平臺(tái)。
SPSS數(shù)據(jù)分析軟件
SPSS 英文全稱(chēng)是 Statistical Product and Service Solutions,是世界上最早數(shù)據(jù)統(tǒng)計(jì)軟件,在1968年由美國(guó)斯坦福大學(xué)的三位研究生研發(fā),
現(xiàn)今被IBM收購(gòu),并命名IBM SPSS,廣泛應(yīng)用于商業(yè)數(shù)據(jù)分析。IBM SPSS是一款預(yù)測(cè)性分析軟件,包括整個(gè)分析流程:規(guī)劃、數(shù)據(jù)收集、分析、
報(bào)告和部署,它提供統(tǒng)計(jì)學(xué)分析和報(bào)告,預(yù)測(cè)建模、數(shù)據(jù)挖掘、決策管理與部署以及大數(shù)據(jù)分析等功能,
應(yīng)用行業(yè):銀行業(yè)、零售及消費(fèi)品行業(yè)、保險(xiǎn)業(yè)、能源與公用事業(yè)、旅游與運(yùn)輸業(yè)等。
SAS分析軟件
SAS 英文全稱(chēng)是Statistical Analysis System, 由美國(guó)北卡羅來(lái)納州立大學(xué)開(kāi)發(fā)的統(tǒng)計(jì)分析軟件,它是一個(gè)模塊化、集成化的大型應(yīng)用軟件系統(tǒng),
它由數(shù)十個(gè)專(zhuān)用模塊組成,主要的功能包括數(shù)據(jù)訪(fǎng)問(wèn)、數(shù)據(jù)儲(chǔ)存及管理、應(yīng)用開(kāi)發(fā)、圖形處理、數(shù)據(jù)分析、報(bào)告設(shè)計(jì)、運(yùn)籌學(xué)方法、計(jì)量經(jīng)濟(jì)學(xué)與預(yù)測(cè)等。
SAS系統(tǒng)大概可以分為四大部分:SAS數(shù)據(jù)庫(kù)部分;SAS核心分析工具;SAS開(kāi)發(fā)展現(xiàn)工具;對(duì)分布模式的支持及其數(shù)據(jù)倉(cāng)庫(kù)設(shè)計(jì)部分。
SAS系統(tǒng)主要實(shí)現(xiàn)了以數(shù)據(jù)為中心的四大功能:數(shù)據(jù)訪(fǎng)問(wèn)、數(shù)據(jù)管理、數(shù)據(jù)呈現(xiàn)、數(shù)據(jù)分析。
應(yīng)用行業(yè):制造業(yè)、保險(xiǎn)業(yè)、醫(yī)療保健、汽車(chē)行業(yè)、銀行業(yè)、公用事業(yè)、高科技制造業(yè)、教育等。
Minitab軟件
Minitab 是現(xiàn)代質(zhì)量管理統(tǒng)計(jì)的領(lǐng)先者,由美國(guó)的賓夕法尼亞州州立大學(xué)研發(fā),它供數(shù)據(jù)分析所需要的全部工具,
通過(guò)引導(dǎo)你選擇正確的分析方法并提供清晰的輸出報(bào)告結(jié)果。
它也提供了便捷的功能,例如簡(jiǎn)化的工作流, 使用全面的統(tǒng)計(jì)量來(lái)探索數(shù)據(jù)的方法,以及可視化的圖形報(bào)表。
應(yīng)用行業(yè):金融、保險(xiǎn)行業(yè)、電子、電信行業(yè)、電器、機(jī)械行業(yè)、運(yùn)輸、物流行業(yè)、教育行業(yè)等。
Stata統(tǒng)計(jì)軟件
Stata統(tǒng)計(jì)軟件由美國(guó)計(jì)算機(jī)資源中心(Computer Resource Center)1985年研發(fā),是一款數(shù)據(jù)分析、數(shù)據(jù)管理以及繪制專(zhuān)業(yè)圖表的統(tǒng)計(jì)分析軟件,
并與SAS、SPSS一起被稱(chēng)為三大權(quán)威軟件,其特點(diǎn)具有數(shù)據(jù)管理、統(tǒng)計(jì)分析、繪制圖表、矩陣計(jì)算和程序語(yǔ)言,
其圖表主要包括直方圖、條形圖、百分條圖、餅圖、散點(diǎn)圖、散點(diǎn)圖矩陣、星形圖等
JMP數(shù)據(jù)探索、挖掘、分析軟件
JMP是SAS旗下業(yè)務(wù)部門(mén)之一,由1989年推出一款統(tǒng)計(jì)發(fā)現(xiàn)軟件,在桌面環(huán)境上創(chuàng)造了交互式的可視化功能和分析功能,
JMP涵蓋了工業(yè)統(tǒng)計(jì)中的所有主題:統(tǒng)計(jì)質(zhì)量控制、可靠性及實(shí)驗(yàn)設(shè)計(jì)(DOE)。 JMP的DOE最初作為附加產(chǎn)品的形式出現(xiàn),
用于創(chuàng)建經(jīng)典設(shè)計(jì),之后逐漸發(fā)展成為豐富的集成環(huán)境,用于設(shè)計(jì)試驗(yàn),以期實(shí)現(xiàn)現(xiàn)有資源的最高使用效率,
JMP致力于開(kāi)發(fā)各種創(chuàng)新功能,以幫助用戶(hù)更快地將數(shù)據(jù)可視化并理解數(shù)據(jù),采用適當(dāng)?shù)姆治霾?shí)現(xiàn)統(tǒng)計(jì)發(fā)現(xiàn)。
數(shù)據(jù)導(dǎo)入和處理從此變得輕松簡(jiǎn)單
Crystal Report報(bào)表軟件
Crystal Report是一個(gè)功能強(qiáng)大的、比較流行的報(bào)表工具,一款商務(wù)智能(BI)軟件,主要用于設(shè)計(jì)及產(chǎn)生報(bào)表,
它有Crystal Report Designer、Crystal Report Viewer、Crystal Report Engine等重要的組件,
支持多種報(bào)表樣式:普通行列報(bào)表、主子報(bào)表,交叉表,圖形報(bào)表,支持20多種圖形:柱形圖、股票圖,漏斗圖,條形圖,餅圖,
曲線(xiàn)圖,甘特圖,雷達(dá)圖,氣泡圖等
AnyReport數(shù)據(jù)分析平臺(tái)
AnyReport 是一款Java開(kāi)發(fā)的報(bào)表軟件,跨平臺(tái),主要的功能包括數(shù)據(jù)收集、數(shù)據(jù)管理、業(yè)務(wù)流程、圖表設(shè)計(jì)、數(shù)據(jù)統(tǒng)計(jì)分析。
支持ppt、word、excel、pdf等office文件輸出,其特點(diǎn)可以通過(guò)瀏覽器在線(xiàn)設(shè)計(jì)報(bào)表、在線(xiàn)瀏覽報(bào)表,收集數(shù)據(jù)流程化,支持?jǐn)?shù)據(jù)鉆取、挖掘、分析。
評(píng)論