數(shù)據(jù)倉庫、OLAP與數(shù)據(jù)挖掘關(guān)系概述_第1頁
數(shù)據(jù)倉庫、OLAP與數(shù)據(jù)挖掘關(guān)系概述_第2頁
數(shù)據(jù)倉庫、OLAP與數(shù)據(jù)挖掘關(guān)系概述_第3頁
數(shù)據(jù)倉庫、OLAP與數(shù)據(jù)挖掘關(guān)系概述_第4頁
數(shù)據(jù)倉庫、OLAP與數(shù)據(jù)挖掘關(guān)系概述_第5頁
已閱讀5頁,還剩2頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、 關(guān)鍵詞:數(shù)據(jù)倉庫 OLAP 數(shù)據(jù)挖掘 特征(1)數(shù)據(jù)倉庫的數(shù)據(jù)是面向主題的。主題是一個(gè)抽象的概念,是較高層次 (2)數(shù)據(jù)倉庫的數(shù)據(jù)是集成的 。數(shù)據(jù)倉庫的數(shù)據(jù)是從原有的分散的數(shù)據(jù)庫 (3)數(shù)據(jù)倉庫的數(shù)據(jù)是不可更新的。數(shù)據(jù)倉庫的數(shù)據(jù)主要供企業(yè)決策分析 (4)數(shù)據(jù)倉庫的數(shù)據(jù)是隨時(shí)間不斷變化的。數(shù)據(jù)倉庫的用戶進(jìn)行分析處理 類型 和數(shù)據(jù)集市(Data Marts)。(1)企業(yè)數(shù)據(jù)倉庫為通用數(shù)據(jù)倉庫,它既含有大量詳細(xì)的數(shù)據(jù),也含有大 (2)操作型數(shù)據(jù)庫既可以被用來針對(duì)工作數(shù)據(jù)做決策支持,又可用做將數(shù) 。(3)數(shù)據(jù)集市是為了特定的應(yīng)用目的或應(yīng)用范圍,從而數(shù)據(jù)倉庫中獨(dú)立出 數(shù)據(jù),也可稱為部門數(shù)據(jù)或主題數(shù)據(jù)。

2、幾組數(shù)據(jù)集市可以組成一個(gè) 度方式分析數(shù)據(jù),而能彈性地提供積存上鉆(Roll-up)、下鉆(Drill-down)、和 透視分析(pivot)等操作,呈現(xiàn)集成性決策信息的方法,多用于決策支持系統(tǒng)、 決策提供參考和支持。與之相區(qū)別的是聯(lián)機(jī)交易處理(OLTP)。 同的理解。廣義上的理解與字面意思相 即與多維分析相關(guān),基于立方體(CUBE)計(jì)算而進(jìn)行的分析。 需要的不是某一指標(biāo)單一的值,而是希望 等各 (1)切片操作:是在給定的多維數(shù)據(jù)集的某一個(gè)維上選定一維成員,從而 得到一個(gè)多維數(shù)據(jù)子集的動(dòng)作。如果有(維1,維 2,維i,維n,度量) 維 n,度量)就是多維數(shù)據(jù)集(維 1,維 2,維 i,維 n,度

3、量)在維 i (2)切塊操作:在多維數(shù)據(jù)集的某一維上選定某一區(qū)間的維成員的操作稱 (3)旋轉(zhuǎn)是一種目視操作,它轉(zhuǎn)動(dòng)多維數(shù)據(jù)集的視角,提供數(shù)據(jù)的替代表 (4)鉆取分為向下鉆取和向上鉆取。下鉆操作是由不太詳細(xì)的高層次匯總 (6)其它的 OLAP 操作還包括計(jì)算統(tǒng)計(jì)表中的最高或最低 N 項(xiàng)、平均值、 數(shù)據(jù)挖掘(Data mining),又譯為資料探勘、數(shù)據(jù)挖掘、數(shù)據(jù)采礦。它是數(shù) 數(shù)據(jù)挖掘一般是指從大量的數(shù)據(jù)中自動(dòng)搜索隱藏于其中的有著特殊關(guān)系性(屬于 3.1 數(shù)據(jù)挖掘與傳統(tǒng)數(shù)據(jù)分析的區(qū)別 連鎖店通過數(shù)據(jù)挖掘發(fā)現(xiàn)了小孩尿布和啤酒之間有 用的、最終可理解的模式的過程;而數(shù)據(jù)挖掘是 3.2 數(shù)據(jù)挖掘的分析方法 (1)關(guān)聯(lián)分析,即利用關(guān)聯(lián)規(guī)則進(jìn)行數(shù)據(jù)挖掘。在數(shù)據(jù)挖掘研究領(lǐng)域,對(duì) 研究開展得比較深入,人們提出了多種關(guān)聯(lián)規(guī)則的挖掘算法,如 (3)分類分析,設(shè)有一個(gè)數(shù)據(jù)庫和一組具有不同特征的標(biāo)記,該數(shù)據(jù)庫中 。(4) 聚類分析與分類分析不同,聚類分析輸入的是一組未分類記錄,并且 不知道。聚類分析就是通過分析數(shù)據(jù)庫中的記錄數(shù) 合理地劃分記錄集合,確定每個(gè)記錄所在類別。它所 動(dòng)態(tài)聚類法、模糊聚類法、運(yùn)籌方法等。采用不同的 掘是從巨 息的一種過程與技術(shù)”。 一系列假設(shè)驅(qū)動(dòng),通過 OLAP 來證實(shí)或者推翻這些假設(shè),是一個(gè)演繹推理的過 數(shù)據(jù)倉庫可以作為數(shù)據(jù)挖掘和 OLA

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

評(píng)論

0/150

提交評(píng)論