當前位置:首頁 » 服務存儲 » 小型企業存儲數據的案例
擴展閱讀
webinf下怎麼引入js 2023-08-31 21:54:13
堡壘機怎麼打開web 2023-08-31 21:54:11

小型企業存儲數據的案例

發布時間: 2023-03-24 08:05:47

A. 求一些"數據倉庫和數據挖掘"的案例

與商業智能相關的詞彙有例如數據倉庫,數據裝載(ETL),數據挖掘(Data Mining), 客戶關系管理(CRM),SAS,PeopleSoft, SAP等。理清他們之間的關系才能准確制訂個人職業發展規劃。

到上個世紀九十年代,以數據存儲為目的的聯機分析處理系統(OLTP)已經發展得相當成熟,關系型資料庫的應用已經非常普及,大型企業或部門積累了大量原始數據。這些數據是按照關系型結構存儲,在更新,刪除,有效存儲(少冗餘數據)方面表現出色,但在復雜查詢方面效率卻十分低下。為充分利用已有數據,提供復雜查詢,提供更好的決策支持,出現了數據倉庫(Data Warehouse)。數據倉庫與資料庫(這里的資料庫指關系型資料庫)的區別在於,數據倉庫以方便查詢(稱為主題)為目的,打破關系型資料庫理論中標准泛式的約束,將資料庫的數據重新組織和整理,為查詢,報表,聯機分析等提供數據支持。數據倉庫建立起來後,定期的數據裝載(ETL)成為數據倉庫系統一個主要的日常工作。

在數據倉庫發展的同時,一項從大量數據中發現隱含知識的技術也在學術領域興起,這就是數據挖掘。數據挖掘也稱為資料庫知識發現(Knowledge Discovery in Databases, KDD),就是將高級智能計算技術應用於大量數據中,讓計算機在有人或無人指導的情況下從海量數據中發現潛在的,有用的模式(也叫知識)。最初的數據挖掘應用一般需要從組織數據做起,經歷演算法設計(建模),挖掘,評價,改進等步驟。其中組織整理數據占據大部分時間,大約佔到整個數據挖掘項目80%的時間。

數據挖掘是近年來信息爆炸推動下的新興產物,是從海量數據中提取有用知識的熱門技術。傳統的交易型系統,九十年代興起的互連網技術及ERP系統在越來越廉價的存儲設備配合下,產生了大量的數據。但與之相配合的數據分析和知識提取技術在相當長一段時間里沒有大的進展,使得存儲的大量原始數據沒有被充分利用,轉化成指導生產的「知識」,形成「數據的海洋,知識的荒漠」這樣一種奇怪的現象。

數據挖掘(Data Mining)就是從大量數據中發現潛在規律、提取有用知識的方法和技術。因為與資料庫密切相關,又稱為資料庫知識發現(Knowledge Discovery in Databases,KDD)。數據挖掘不但能夠學習已有的知識,而且能夠發現未知的知識;得到的知識是「顯式」的,既能為人所理解,又便於存儲和應用,因此一出現就得到各個領域的重視。從80年代末的初露頭角到90年代末的廣泛應用,以數據挖掘為核心的商業智能(BI)已經成為IT及其它行業中的一個新寵。目前數據挖掘技術在零售業的貨籃數據(Basket data)分析、金融風險預測、產品產量、質量分析、分子生物學、基因工程研究、Internet站點訪問模式發現以及信息搜索和分類等許多領域得到了成功的應用。如果你訪問著名的亞馬遜網上書店(www.amazon.com),會發現當你選中一本書後,會出現相關的推薦數目「Customers who bought this book also bought」,這背後就是數據挖掘技術在發揮作用。

數據挖掘的真正普及是建立在數據倉庫的成功應用之上。一個設計完善的數據倉庫已經將原始數據經過了整理和變換,在此基礎上再進行深入挖掘就是順理成章的事情。數據挖掘滲透到某些行業,產生了一些特定的應用,比如現在經常會聽到的客戶關系管理(Customer Relationship Management, CRM)。客戶關系管理的概念由來已久,但現代的客戶關系管理一般指以客戶數據為處理對象的一類商業智能應用。通過挖掘客戶信息,發現潛在的消費趨勢或動向。比如電信公司通過分析用戶通話模式(通話時間,時段,通話量等),制訂不同的計費方案,滿足用戶的同時也提高自己的利潤。同其它應用一樣,客戶關系管理發展到一定階段,會出現相應的系統供應商。據2003年1月的一項調查,CRM市場的領先者從高到低依次為PeopleSoft, Seibel, Oracle, SAP. 微軟公司也將加入CRM市場。

從上可以看出,商業智能的應用領域非常廣泛。它通常以數據倉庫為基礎,以數據挖掘為核心,演變出類似CRM這樣的應用。一個商業智能系統的開發涉及到很多知識和技能,能夠從事商業智能系統開發,那當然是最好不過的。如果沒有這樣的機會,對於想進入商業智能領域的朋友,應該如何規劃自己的職業發展?

首先,根據自己想從事的應用領域,比照該行業商業智能應用所需的知識和經驗,找出自己的長處和不足。比如已經有零售業,醫葯業,製造業的工作經驗,或熟悉資料庫,編程,人工智慧,統計學等。然後補充自己的不足。通過與該領域有經驗人士交流,查閱資料,自學或參加相關培訓或選修大學課程都是彌補自己不足的手段。當你對將要從事的工作心中有數後,可以開始嘗試申請入門級職位。不要編造經歷,但要展示你對所申請職位所具備的相關經驗(如 business方面的)和知識(會用到的技術,名詞,清晰的概念)。在得到入門級職位後,要留心更高級職位用到的技術,軟體等。然後利用業余時間繼續補充相關知識。一旦內部有更高級職位的空缺,你又能夠展示你具備的相關知識,就具有很強的競爭里,因為一般情況下公司都會願意給內部職員一個嘗試的機會的。

如果既沒有business背景,又沒有數據挖掘方面經驗,該如何尋求突破呢?下面的例子不是唯一的道路,有心的朋友應該能得到啟發。

一般正規的呼叫中心(這里指呼出服務)的工作方式是這樣的:每天分析員根據現階段的任務,從大量客戶數據中篩選出響應可能性高的客戶名單,交給業務代表;業務代表根據下達的客戶名單做電話推銷,對每個電話的結果做相應記錄;根據客戶實際響應情況,分析員調整篩選演算法,選出第二天的客戶名單;分析客戶響應或不響應的原因。這就是一個典型的客戶關系管理在呼叫中心應用的例子。

取得一個呼叫中心客戶代表的職位並不難。難的是有沒有看到做客戶代表除每小時11,12元工資外潛在的價值。通過做客戶代表,應該對該中心使用的客戶關系管理系統有了應用經驗,通過與主管或分析員的交流,應該了解交到你手裡的客戶名單是怎麼分析出來的。心中有數後,就是等待時機的出現了。一個客戶篩選演算法的改進建議,一個內部分析員職位的空缺,就是展示自己商業智能方面能力的機會。這時的你,已經具備了其他應聘者所不具備的優勢:有相關工作背景知識,熟悉應用環境和內部主管,提前知道空缺消息…

規劃個人職業發展的時候,在眾多考慮因素中有兩個是非常重要的:所要投入的技術所處的發展階段和能否結合已有專業知識。

一種技術從提出到廣泛應用(或失敗被拋棄)有一定的發展周期,稱為科學技術的生命周期(Technological life cycle)。該周期大致分為創新(Innovators),早期成長(Early adopters),分歧點(Chasm),早期流行(Early majority),晚期流行(Late majority)和衰退階段(Laggards)。對於應用型技術人員來說,早期流行階段是進入一個新技術領域的最佳時機,因為該技術已經通過分歧點的考驗,又處於上升階段,風險最小,競爭最少,更容易脫穎而出。數據挖掘技術現在就處在這樣一個早期流行階段。

數據挖掘的對象是某一專業領域中積累的數據;挖掘過程是一個人機交互、多次反復的過程;挖掘的結果要應用於該專業。因此數據挖掘的整個過程都離不開應用領域的專業知識。「Business First, technique second」是數據挖掘的特點。因此學習數據挖掘不意味著丟棄原有專業知識和經驗。相反,有其它行業背景是從事數據挖掘的一大優勢。如有銷售,財務,機械,製造,call center等工作經驗的,通過學習數據挖掘,可以提升個人職業層次,在不改變原專業的情況下,從原來的事務型角色向分析型角色轉變。

我們正處於一個信息爆炸的年代,能夠在第一時間內獲得或者找到最有價值的信息和資源,則成為企業在激烈地競爭中取勝的重要的因素,所以,商業智能(Business Intelligence)應運而生,而與之相關的技術和工具如Data Warehouse、 Data Mining、SAS則以驚人的速度得到快速、蓬勃的發展。

B. 小型企業搭建內部網路文件存儲伺服器有哪幾種方法

  1. 使用電腦主機或者伺服器搭建FTP/SAMBA/NFS服務

  2. 使用NAS網路存儲伺服器

  3. 使用啟耘Box作為網路文件存儲伺服器

C. 小企業如何選購自己需要的數據存儲設備

隨著數據量的幾何級數增長以及信息化的深入,小企業和小型組織購買專用數據存儲設備的需求越來越迫切。例如:剛剛開始創業的小公司,大企業的分支機構或一個大量產生數據並需要長期保存的公司(如設計公司,軟體公司等);還有政府機關的處室,大學的教研室,研究所的研究室以及這些單位的財務或後勤部門等。大多數小企業已經認識到日常的工作數據的共享和合作越來越重要,而把本小企業或本部門的數據隨時備份起來已經是不得不擁有的一個信息化基本功能。盡管數據存儲設備價格不斷走低,但面對錯綜復雜的存儲市場,小企業該如何選擇呢?最好像家電一樣簡單易用數據存儲設備的使用越來越復雜,存儲應用需求也不斷提高,這已經成為小企業使用存儲的一個門檻。另外,如何有效利用存儲軟體資源,象數據存儲設備管理和數據存儲設備資源共享等對一個小企業或小組織幾乎是一個復雜的技術問題。通常,小企業或組織既不可能擁有自己的專職信息化工作人員,也不可能使用非常復雜的信息化設備(如伺服器等)。大多說情況下,只是通過一台ADSL接入寬頻,外接一台交換機連接到所有桌面電腦,即構成了小企業網路。簡單易行、即插即用和便於企業負責人(小企業的經理,政府的處長或大學的教授)直接使用和管理,是小企業的典型需求。所以,小企業需要的是一個入門級網路數據存儲設備。尤其在亞洲,小型辦公環境、網吧、多媒體教室等只有幾十個人使用的一個小型區域網環境下,是一個使用廉價高效的共享存儲的擁護環境。業界曾有公司指出:「許多在歐美家用產品的IT設備,在亞洲往往被作為中小企業辦公設備使用;而在歐美當做中小企業辦公設備的產品,在亞洲卻往往因為價格和使用復雜度等因素被棄用。」。因此,象家用設備那樣簡單的數據存儲設備在亞太地區是有一個相當的市場容量的。網路存儲是首選根據Gartner Inc.公司的副總裁Craig Stanley的研究,平均起來,一個公司每兩年的存儲需求將增加一倍。而當擁有了廉價易用的小型存儲後,需要存儲和備份的數據就會成幾何級數的增長。由於小型企業或組織擁有良好的本地網路環境,而伺服器需要有懂IT的員工去安裝,調試,維護和升級換代,移動硬碟又很難做到共享和給組織內提供備份功能,所以,小企業和小組織正在日益轉向使用網路存儲,以幫助他們更好的管理猛烈的存儲需求。網路存儲(NAS)無疑是小企業存儲最簡單的數據存儲設備,因為每個小企業和組織不可能沒有自己的區域網系統,所以網路存儲是小企業使用存儲的首選。數據共享和備份小企業對存儲的最基本要求就是能夠讓每個員工有一個更大的存儲空間去共享和備份數據。所以小企業或小組織的負責人需要做的無非是在該數據存儲設備上給每個部門和員工設置使用許可權,以向本組織的所有工作人員提供訪問存儲的用戶空間。有了自己的存儲空間後,每個員工就可以把自己台式機或便攜機的數據按文件方式,系統方式或增量方式等備份在數據存儲設備中。共享是小企業和組織另外一個經常用到的功能。每個部門無疑在該部門的員工之間一定要有共享空間,以分享該部門需要的資料、信息和各種數據(如試驗數據,市場調研數據等)。除此之外,每個企業和組織都需要建立組織臨時的跨部門機構以協力完成一個工作任務。如,景觀設計公司承接一個用戶項目,它需要設計師,工程部和預算部等的員工組成一個小組完成該項目的設計工作。而政府部門的任務,如質監局質量處解決一個品牌商品的質量問題,也需要該處室幾個公務員協同調查,分析取證等。這也需要在該組公務員中建立共享區以利於大家協同工作和未來的分析報告。大學的一個科研項目則更需要建立共享去以便在教授(學術帶頭人),教師,研究生,本科生和實驗室工作人員中為該項目建立一個共享區,共同完成科研項目。小企業和組織另外一個需要簡單存儲的領域是數據備份。當今,人類已經離不開計算機去完成日常工作,但計算機被病毒侵蝕,被丟失和偷盜,被損壞已經是家常便飯了。既然如此,數據備份就成為各種組織所不得不採取的防範措施。對於小企業和組織,簡單的數據備份就能使他保證該組織工作的連續性。無論是前述例子中的公司的設計人物、政府的調查分析取證和報告還是高校的科研項目,一旦數據丟失,哪怕只是參加該工作的一個成員都會對該任務的進程帶來不可估量的影響。尤其是如果這些工作帶有設計的創意性,或數據的採集分析結果,或科研的實驗室試驗數據,甚至是不可恢復的。所以數據備份就成為該小企業或組織的必須。既然小企業和組織的小型存儲是必須的數據存儲設備,磁碟備份就是他不得不考慮的一個功能。即存在小型存儲器的數據,如果該存儲器的硬碟出現故障應該如何處理。磁碟備份就是小企業和組織所可以選用的功能。在一個有四個盤位的小型存儲器中,可以將它設置成能夠磁碟備份的模式。

D. 中小企業如何實現統一數據存儲

中小企業和統一數據存儲是一對完美的搭檔。同樣,統一存儲對遠程辦公室、子辦公室(ROBO)和SOHO環境也很合適。統一數據存儲適合中小企業的原因是由於它的靈活性和常規的多用途功能。它還可以輕松地應用於中小企業的各種需求中。大型的數據存儲環境可能擁有各種類型的數據存儲解決方案,來滿足不同的需求,但是中小企業可以利用更靈活的數據存儲解決方案。 大型企業也可以從統一數據存儲中受益,但是中小企業可以利用統一存儲,從而利用現有的IT資產獲得更多的使用。中小企業應該在想要或者需要靈活地支持模塊或者文件,或者SAS、iSCSI 或FC模塊、iSCSI和NAS等設備的聯合體的時候,使用統一數據存儲。例如,如果你需要5TB的可用存儲,還需要RAID等級聯合體的數據保護,你可能最好就需要10TB的物理存儲。所以與其買5TB的NAS用於常規文件服務、主目錄和其他數據,還要買5TB的模塊存儲系統用於資料庫、交換機和其他應用,還不如尋找具有增長空間的10TB的統一存儲解決方案。 還有,你應該查查可疑支持不同協議的方案,他們需要可以滿足你的應用需要,還要支持分層存儲(例如SSD和快速的15K SAS磁碟,以及高性能的SAS/SATA磁碟驅動)。

E. 企業中的數據是如何產生的如何保存的

企業的數據通常保存在各部門主管的電腦內,這樣很容易形成數據孤島。


什麼是數據孤島?

簡單來說,就是企業發展到一定階段時,各個部門各自存儲數據,部門之間的數據無法共通,這導致這些數據像一個個孤島一樣缺乏關聯性。 (最終常常因為難以流通和利用而變成死數據)



它會帶來兩種類型:

  • 邏輯性數據孤島:不同部門站在自己角度定義數據,使得相同數據被賦予不同含義,加大了跨部門數據合作的溝通成本。

  • 物理性數據孤島:數據在不同部門相互獨立存儲,獨立維護,彼此間相互孤立。

  • 數據孤島是如何形成的?又要如何解決?

    1)以功能為標準的部門劃分導致數據孤島:

    企業各部門之間相對獨立,數據各自保管存儲,對數據的認知角度也截然不同,最終導致數據之間難以互通,形成孤島。也因此集團化的企業更容易產生數據孤島的現象。

  • 面對這種情況,企業需要採用制定數據規范、定義數據標準的方式,規范化不同部門之間對數據的認知,任重而道遠~

  • 2)不同類型、不同版本的信息化管理系統導致數據孤島:

    人事部門用OA系統,生產部門用ERP系統,銷售部門用CRM系統,甚至一個人事部門使用一家考勤軟體的同時,卻在同時使用另一家的報銷軟體,後果就是一家企業的數據互通越來越難。