淺談數(shù)據(jù)倉庫技術_第1頁
淺談數(shù)據(jù)倉庫技術_第2頁
淺談數(shù)據(jù)倉庫技術_第3頁
淺談數(shù)據(jù)倉庫技術_第4頁
淺談數(shù)據(jù)倉庫技術_第5頁
全文預覽已結束

付費下載

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、淺談數(shù)據(jù)倉庫技術論文導讀:數(shù)據(jù)倉庫的英文名稱為DataWarehouse,簡寫DW。從數(shù)據(jù)倉庫的概念上我們可以從兩個方面理解,一方面,數(shù)據(jù)倉庫是用來支持決策的,主要面向分析型數(shù)據(jù)處理,這一點有別于企業(yè)現(xiàn)有的操作型數(shù)據(jù)庫。關鍵詞:數(shù)據(jù)庫,數(shù)據(jù)倉庫,數(shù)據(jù)處理1.數(shù)據(jù)倉庫的定義數(shù)據(jù)倉庫的英文名稱為Data Warehouse,簡寫DW。W.H.Inmon。我們把它的定義為:數(shù)據(jù)倉庫是一個數(shù)據(jù) 集合,它的特點是:用于支持管理決策時它是面向主題的,集成的,相對穩(wěn)定的,能夠反映歷史變化的。從數(shù)據(jù)倉庫的概念上我們可以從兩個方面理解,一方面,數(shù)據(jù)倉庫是用來支持決策的,主要面向分析 型數(shù)據(jù)處理,這一點有別于企業(yè)

2、現(xiàn)有的操作型數(shù)據(jù)庫;另一方面,數(shù)據(jù)倉庫對多個異構的數(shù)據(jù)源進行有效集成,在集成后又按照主題重新進行了組合,并且包含歷史數(shù)據(jù),盡管如此,卻一般不再修改其存放在數(shù)據(jù)倉庫里的數(shù)據(jù)。2.數(shù)據(jù)倉庫的特點(1)面向主題。操作型數(shù)據(jù)庫的數(shù)據(jù)組織面向事務處理任務,各個業(yè)務系統(tǒng)之間各自分離,而數(shù)據(jù)倉庫中的數(shù)據(jù)是按照一定的主題域進行組織,一個主題通常與多個操作型信息系統(tǒng)相關。論文發(fā)表。(2)集成的。面向事務處理的操作型數(shù)據(jù)庫通常與某些特定的應用相關,數(shù)據(jù)庫之間相互獨立,并且往往是異構的。而數(shù)據(jù)倉庫中的數(shù)據(jù)是在對原有分散的數(shù)據(jù)庫數(shù)據(jù)抽取、清理的基礎上經過系統(tǒng)加工、匯總和整理得到的,必須保證數(shù)據(jù)倉庫內的信息是關于整個企

3、業(yè)的一致的全局信息。(3)相對穩(wěn)定的。操作型數(shù)據(jù)庫中的數(shù)據(jù)通常實時更新,數(shù)據(jù)根據(jù)需要及時發(fā)生變化。數(shù)據(jù)倉庫的數(shù)據(jù)主要供企業(yè)決策分析只用,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢,一旦某個數(shù)據(jù)進入數(shù)據(jù)倉庫之后,一般情況下將被長期保留,修改和刪除操作很少,通常只需要定期的加載、刷新。論文發(fā)表。(4)反映歷史變化。操作型數(shù)據(jù)庫主要關心當前某一個時間段內的數(shù)據(jù),而數(shù)據(jù)倉庫中的數(shù)據(jù)通常包含歷史信息,系統(tǒng)記錄了企業(yè)從過去某一時點到目前的各個階段的信息,以對企業(yè)的發(fā)展歷程和未來趨勢做出定量分析和預測。3.數(shù)據(jù)倉庫的結構如上圖所示,整個數(shù)據(jù)倉庫系統(tǒng)包含五個層次:(1)數(shù)據(jù)源層。是數(shù)據(jù)倉庫系統(tǒng)的基礎,是整個系統(tǒng)的數(shù)據(jù)源泉

4、。通常包括企業(yè)內部信息和外部信息。論文發(fā)表。(2)數(shù)據(jù)導入層。是數(shù)據(jù)在進入數(shù)據(jù)倉庫前的一個臨時存放區(qū),通過數(shù)據(jù)調度工具將業(yè)務系統(tǒng)傳送過來的數(shù)據(jù)表、文本文件等加載到臨時存放區(qū)。(3)數(shù)據(jù)服務層。是整個數(shù)據(jù)倉庫系統(tǒng)的核心。針對現(xiàn)有各業(yè)務系統(tǒng)的數(shù)據(jù),進行抽取、清理,并有效集成,按照主題進行組織。數(shù)據(jù)倉庫按照數(shù)據(jù)的覆蓋范圍可以分為企業(yè)級數(shù)據(jù)倉庫和部門級數(shù)據(jù)倉庫(通常稱為數(shù)據(jù)集市)。(4)應用服務層。應用服務層的功能主要是建立多維數(shù)據(jù)集、進行OLAP分析、生成各種靜態(tài)報表并以WEB方式提供各種功能的查詢分析。(5)用戶層。根據(jù)對數(shù)據(jù)倉庫需求的不同,數(shù)據(jù)倉庫的用戶可以分為普通用戶、技術用戶、高級管理用戶這

5、三類。不同用戶對數(shù)據(jù)倉庫訪問的需求層次以及復雜度都是不同的,簡單的需求是訪問一些固定的靜態(tài)報表和查詢分析,復雜的可以通過前端展現(xiàn)的工具生產一些靈活、動態(tài)的即席查詢報表,以滿足業(yè)務部門一些臨時的、迫切的報表需求。4.相關的網站和論壇:(1)數(shù)據(jù)倉庫之路 (2)MyDWBI致力于打造最專業(yè)的中文數(shù)據(jù)倉庫,商務智能社區(qū)(3)商業(yè)智能和數(shù)據(jù)倉庫愛好者(4)數(shù)據(jù)挖掘研究院 5研究和商業(yè)機構(1) 北京大學移動通信數(shù)據(jù)倉庫聯(lián)合實驗室2006年5月由中國移動、北京大學、亞信集團聯(lián)合建立,該實驗室”是全球容量最大的數(shù)據(jù)倉庫分析系統(tǒng)實驗室,也有效的整合了三方得優(yōu)勢資源。中國移動通信目前構建了目前國際上最大的數(shù)據(jù)

6、倉庫系統(tǒng),聯(lián)合實驗室的建立,既能推動中國移動自身數(shù)據(jù)倉庫系統(tǒng)建設,也能明顯推動數(shù)據(jù)倉庫技術向縱深發(fā)展。(2)中國人民大學數(shù)據(jù)倉庫和商務智能實驗室2004年5月由中國人民大學和全球著名的數(shù)據(jù)倉庫廠商NCRTeradata聯(lián)合建立。該實驗室承擔了國家863計劃、國家自然科學基金重點項目、教育部重點項目等國家重大科研任務。借助于NCRTeradata的優(yōu)勢技術,雙方將通過密切的合作,共同開發(fā)具有中國行業(yè)特色的數(shù)據(jù)倉庫和商務智能應用軟件。(3)北京漢端科技有限公司北京漢端公司是一家專門從事商業(yè)智能信息化服務的企業(yè),從1996年就開始專業(yè)做數(shù)據(jù)倉庫,它在數(shù)據(jù)倉庫領域是相當專業(yè)的,在這可以接觸到最前沿的數(shù)據(jù)倉庫技術。(4)上證所金融創(chuàng)新實驗室2006由上海證券交易所成立,該實驗室的數(shù)據(jù)全部來源于數(shù)據(jù)倉庫系統(tǒng)。 上證所在推出金融新產品時,都曾通過數(shù)據(jù)倉庫平臺進行過測算和驗證。通過實時數(shù)據(jù)倉庫技術,為上證所的經營、監(jiān)管、創(chuàng)新和服務決策提供數(shù)據(jù)支持,極大的提高了監(jiān)管的效率和服務的性能,能夠更好地服務市場和監(jiān)管市場。參考文獻:1伍小榮 伍慶華 數(shù)據(jù)倉庫技術的研究現(xiàn)狀和未來方向 期刊論文 現(xiàn)代電子技術2002(6)2.向海華 數(shù)據(jù)庫技術發(fā)展綜述期刊論文 現(xiàn)代情報 2003(12)3.王

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論