1. 大數據分析需要哪些知識
數據分析需要掌握的知識:
1、數學知識
數學知識是數據分析師的基礎知識。對於初級數據分析師,了解一些描述統計相關的基礎內容,有一定的公式計算能力即可,了解常用統計模型演算法則是加分。
對於高級數據分析師,統計模型相關知識是必備能力,線性代數(主要是矩陣計算相關知識)最好也有一定的了解。
2、分析工具
對於初級數據分析師,玩轉Excel是必須的,數據透視表和公式使用必須熟練,VBA是加分。另外,還要學會一個統計分析工具,SPSS作為入門是比較好的。
對於高級數據分析師,使用分析工具是核心能力,VBA基本必備,SPSS/SAS/R至少要熟練使用其中之一,其他分析工具(如Matlab)視情況而定。
3、分析思維
比如結構化思維、思維導圖、或網路腦圖、麥肯錫式分析,了解一些smart、5W2H、SWOT等等那就更好了。不一定要掌握多深多全,但一定要了解一些。
4、資料庫知識
大數據大數據,就是數據量很多,Excel就解決不了這么大數據量的時候,就得使用資料庫。如果是關系型資料庫,比如Oracle、mysql、sqlserver等等,你還得要學習使用SQL語句,篩選排序,匯總等等。非關系型資料庫也得要學習,比如:Cassandra、Mongodb、CouchDB、Redis、 Riak、Membase、Neo4j 和 HBase等等,起碼常用的了解一兩個,比如Hbase,Mongodb,redis等。
5、開發工具及環境
比如:Linux OS、Hadoop(存儲HDFS,計算Yarn)、Spark、或另外一些中間件。目前用得多的開發工具Java、python等等語言工具。
2. SQLServer
SQLServer2008R2基於SQLServer2008提供可靠高效的智能數據平台構建而成,SQLServer2008R2提供了大量新改進,可幫助您的組織滿懷信心地調整規模、提高IT效率並實現管理完善的自助BI。此版本中包含應用程序和多伺服器管理、復雜事件處理、主數據服務及最終用戶報告等方面的新功能和增強功能。
SQLServer2008R2新派蘆增了大量重要功能,在性能和可擴展性方面也有了極大提升。主要功能包括:
PowerPivot:
這是一種自主託管分析方案,幫助終端用戶在IT管理環境中使用Excel2010和SharePoint2010訪問、分析和共享企業數據。
主數據服務:
幫助IT組織實現中央管理全公司及跨系統的重要數據資產,允許更多用戶安全地直接管理主數據。
應用程序和多伺服器管理:
幫助企業前攝地管理資料庫環境。
ReportBuilder3.0
其主要特性包括:
實用性高的可信賴和可擴展平台,主數據服務支持異構系統間的數據協調,能夠實現對大規模復雜事件的處理,並支持多達256個邏輯處理器的大型應用程序。
通過對多種資料庫應用程序、實例或伺服器的集銀羨信中管理提高IT和開發人員的效率,加快應用程序的開發和部署,通過WindowsServer2008R2中的Hyper-V來完善對虛擬化和實時鋒輪遷移的支持。
可託管的自助式商業智能(self-servicebusiness)賦予企業用戶在無IT支持的情況下創建並分享強大的商業智能(BI)方案的能力,同時還可以使用Excel和SharePoint中最新的PowerPivot技術監控和管理終端用戶生成的BI方案