歡迎來(lái)到裝配圖網(wǎng)! | 幫助中心 裝配圖網(wǎng)zhuangpeitu.com!
裝配圖網(wǎng)
ImageVerifierCode 換一換
首頁(yè) 裝配圖網(wǎng) > 資源分類(lèi) > PPT文檔下載  

數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)概述.ppt

  • 資源ID:11543553       資源大?。?span id="5gcsoia" class="font-tahoma">700.50KB        全文頁(yè)數(shù):32頁(yè)
  • 資源格式: PPT        下載積分:9.9積分
快捷下載 游客一鍵下載
會(huì)員登錄下載
微信登錄下載
三方登錄下載: 微信開(kāi)放平臺(tái)登錄 支付寶登錄   QQ登錄   微博登錄  
二維碼
微信掃一掃登錄
下載資源需要9.9積分
郵箱/手機(jī):
溫馨提示:
用戶名和密碼都是您填寫(xiě)的郵箱或者手機(jī)號(hào),方便查詢和重復(fù)下載(系統(tǒng)自動(dòng)生成)
支付方式: 支付寶    微信支付   
驗(yàn)證碼:   換一換

 
賬號(hào):
密碼:
驗(yàn)證碼:   換一換
  忘記密碼?
    
友情提示
2、PDF文件下載后,可能會(huì)被瀏覽器默認(rèn)打開(kāi),此種情況可以點(diǎn)擊瀏覽器菜單,保存網(wǎng)頁(yè)到桌面,就可以正常下載了。
3、本站不支持迅雷下載,請(qǐng)使用電腦自帶的IE瀏覽器,或者360瀏覽器、谷歌瀏覽器下載即可。
4、本站資源下載后的文檔和圖紙-無(wú)水印,預(yù)覽文檔經(jīng)過(guò)壓縮,下載后原文更清晰。
5、試題試卷類(lèi)文檔,如果標(biāo)題沒(méi)有明確說(shuō)明有答案則都視為沒(méi)有答案,請(qǐng)知曉。

數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)概述.ppt

數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)概述數(shù)據(jù)倉(cāng)庫(kù),參考教材,數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘原理及應(yīng)用技術(shù)王麗珍等,科學(xué)出版社,2004年其它參考書(shū)B(niǎo)uildingthedatawarehouse,W.HInmon,機(jī)械工業(yè)出版社2004TheDataWarehouseToolkit(2ndEdition)R.Kimball電子工業(yè)出版社2002DataMining:ConceptsandTechniques.JiaweiHanandMichelineKamber.機(jī)械工業(yè)出版社,2001.史忠植,知識(shí)發(fā)現(xiàn),清華大學(xué)出版社,2002,課程主要內(nèi)容,概述數(shù)據(jù)倉(cāng)庫(kù)聯(lián)機(jī)分析處理數(shù)據(jù)倉(cāng)庫(kù)的設(shè)計(jì)數(shù)據(jù)預(yù)處理維度建模數(shù)據(jù)挖掘聚類(lèi)關(guān)聯(lián)規(guī)則分類(lèi),概述-數(shù)據(jù)倉(cāng)庫(kù)基本概念,數(shù)據(jù)倉(cāng)庫(kù)技術(shù)產(chǎn)生的背景什么是數(shù)據(jù)倉(cāng)庫(kù)技術(shù),信息技術(shù)發(fā)展的幾個(gè)階段,1960s:數(shù)據(jù)采集、數(shù)據(jù)庫(kù)創(chuàng)建階段集中于原始文件的處理層次數(shù)據(jù)庫(kù)和網(wǎng)狀數(shù)據(jù)庫(kù)1970s:關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)關(guān)系數(shù)據(jù)模型和關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)E-R模型、SQL語(yǔ)言、查詢處理和優(yōu)化、OLTP(恢復(fù)和并發(fā)技術(shù))1980s:高級(jí)數(shù)據(jù)庫(kù)管理系統(tǒng)面向?qū)ο髷?shù)據(jù)庫(kù)、對(duì)象關(guān)系數(shù)據(jù)庫(kù)、主動(dòng)數(shù)據(jù)庫(kù)、演繹數(shù)據(jù)庫(kù)、模糊數(shù)據(jù)庫(kù)、空間數(shù)據(jù)庫(kù)、時(shí)空數(shù)據(jù)庫(kù)、統(tǒng)計(jì)數(shù)據(jù)庫(kù)數(shù)據(jù)挖掘技術(shù)1990s:數(shù)據(jù)倉(cāng)庫(kù)、聯(lián)機(jī)分析處理和數(shù)據(jù)挖掘數(shù)據(jù)倉(cāng)庫(kù)、聯(lián)機(jī)分析處理和數(shù)據(jù)挖掘,多媒體數(shù)據(jù)庫(kù),Web數(shù)據(jù)庫(kù)、DataStream,企業(yè)信息化建設(shè)現(xiàn)狀,在數(shù)據(jù)庫(kù)技術(shù)的支持下,一大批成熟的業(yè)務(wù)信息系統(tǒng)投入運(yùn)行,為企業(yè)發(fā)展作出了巨大貢獻(xiàn)各類(lèi)信息系統(tǒng)大多屬于面向事務(wù)處理的OLTP系統(tǒng)信息系統(tǒng)多年運(yùn)行,積累了大量的數(shù)據(jù)數(shù)據(jù)是一種寶貴的資源,但沒(méi)有充分發(fā)揮作用管理決策層對(duì)數(shù)據(jù)分析基礎(chǔ)平臺(tái)的需求日益強(qiáng)烈,企業(yè)信息化建設(shè)提出了更高的要求,市場(chǎng)競(jìng)爭(zhēng)日益激烈創(chuàng)造競(jìng)爭(zhēng)優(yōu)勢(shì)需要及時(shí)、準(zhǔn)確的做出科學(xué)決策科學(xué)決策必須以準(zhǔn)確、有效的數(shù)據(jù)為基礎(chǔ)充分利用現(xiàn)有數(shù)據(jù),將它轉(zhuǎn)化為信息,分析人員典型的信息需求,覆蓋企業(yè)內(nèi)部信息、合作伙伴信息和市場(chǎng)信息覆蓋綜合信息和明細(xì)信息覆蓋當(dāng)前數(shù)據(jù)和歷史數(shù)據(jù)高可用性高質(zhì)量的數(shù)據(jù)(一致性、完整性)支持各種不同的分析方法數(shù)據(jù)定義符合業(yè)務(wù)人員要求,組織內(nèi)部橫向共享信息數(shù)據(jù)的重構(gòu)個(gè)人授權(quán)服務(wù)和質(zhì)量管理組織之間合作伙伴客戶驅(qū)動(dòng)的解決方案戰(zhàn)略聯(lián)盟價(jià)值鏈和供應(yīng)鏈?zhǔn)袌?chǎng)競(jìng)爭(zhēng)對(duì)手市場(chǎng)分割實(shí)時(shí)的市場(chǎng)行情全球化,操作型數(shù)據(jù)和分析型數(shù)據(jù)的區(qū)別,現(xiàn)有數(shù)據(jù)庫(kù)系統(tǒng)處理分析型應(yīng)用存在的問(wèn)題數(shù)據(jù)可信性,數(shù)據(jù)沒(méi)有同一時(shí)間基準(zhǔn)例如:一個(gè)企業(yè)的兩個(gè)部門(mén)向管理者呈送報(bào)表部門(mén)A,于星期天傍晚抽取了分析所需的數(shù)據(jù),結(jié)論為業(yè)績(jī)上升10%部門(mén)B,于星期三下午抽取了分析所需的數(shù)據(jù),結(jié)論為業(yè)績(jī)下降15%算法不同部門(mén)A使用的是舊帳號(hào)部門(mén)B使用的是大帳號(hào)多次抽取,擴(kuò)大了上述兩個(gè)問(wèn)題用抽取程序從數(shù)據(jù)庫(kù)/文件中抽取數(shù)據(jù),并存放起來(lái),然后又在此基礎(chǔ)上再次進(jìn)行抽取,從數(shù)據(jù)進(jìn)入系統(tǒng)到提供分析往往經(jīng)過(guò)8、9次的抽取。,在實(shí)際中經(jīng)常存在這樣,“蜘蛛網(wǎng)”問(wèn)題,沒(méi)有統(tǒng)一規(guī)劃和設(shè)計(jì)數(shù)據(jù)模型不一致數(shù)據(jù)定義不一致數(shù)據(jù)準(zhǔn)確性差,冗余度高業(yè)務(wù)流程發(fā)生變化歷史數(shù)據(jù)不統(tǒng)一、不規(guī)范解決方案:深入、全面、客觀的數(shù)據(jù)源分析建立數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),數(shù)據(jù)可信性(續(xù)),外部數(shù)據(jù)問(wèn)題一位分析員把華爾街日?qǐng)?bào)的數(shù)據(jù)帶進(jìn)系統(tǒng)另一位將商業(yè)周刊的數(shù)據(jù)進(jìn)入系統(tǒng)數(shù)據(jù)一旦進(jìn)入系統(tǒng),往往已失去“身份”,并且一位分析員也不知道另一位分析員所輸入的數(shù)據(jù)開(kāi)始時(shí)就不是同一個(gè)公共的數(shù)據(jù)源部門(mén)A最初來(lái)源于文件XYZ部門(mén)B最初來(lái)源于DBABC,現(xiàn)有數(shù)據(jù)庫(kù)系統(tǒng)處理分析型應(yīng)用存在的問(wèn)題從數(shù)據(jù)到信息,例如:“今年的帳戶情況與前五年比較”涉及大量應(yīng)用:儲(chǔ)蓄應(yīng)用、貸款、即期匯票管理、信托,而這些應(yīng)用并未集成。沒(méi)有足夠的歷史數(shù)據(jù):貸款部門(mén),擁有二年的數(shù)據(jù)銀行存折處理,擁有一年的數(shù)據(jù)即期匯票管理只有60天的數(shù)據(jù)現(xiàn)金交易處理具有18個(gè)月的數(shù)據(jù)。數(shù)據(jù)不一致問(wèn)題:同名不同義、同義不同名,例如M/F,Male/Female外部數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù),現(xiàn)有數(shù)據(jù)庫(kù)系統(tǒng)處理分析型應(yīng)用存在的問(wèn)題生產(chǎn)率,為了生成一個(gè)企業(yè)報(bào)表,必須經(jīng)過(guò)獲得源數(shù)據(jù)定位和分析數(shù)據(jù):由于同名不同義、同義不同名,很難準(zhǔn)確定位和分析,可能造成進(jìn)一步的混亂把數(shù)據(jù)加工成報(bào)告要寫(xiě)許多程序,每個(gè)程序必須客戶化(與客戶環(huán)境有關(guān))程序會(huì)涉及公司具有的各種技術(shù)由于定位數(shù)據(jù)困難,檢索所要的數(shù)據(jù)是一件很麻煩的事完成任務(wù)需要很長(zhǎng)時(shí)間定位數(shù)據(jù)+獲得數(shù)據(jù)+集成報(bào)告,完成任務(wù)所需時(shí)間較長(zhǎng)每份報(bào)告各自需求不同,因此每份報(bào)告所需要的時(shí)間都很長(zhǎng)。,數(shù)據(jù)倉(cāng)庫(kù)要解決的基本問(wèn)題,全局范圍內(nèi)統(tǒng)一數(shù)據(jù)視圖數(shù)據(jù)內(nèi)容數(shù)據(jù)的完整性數(shù)據(jù)的準(zhǔn)確性數(shù)據(jù)的一致性數(shù)據(jù)組織面向分析決策,第一章數(shù)據(jù)倉(cāng)庫(kù)基本概念,數(shù)據(jù)倉(cāng)庫(kù)技術(shù)產(chǎn)生的背景什么是數(shù)據(jù)倉(cāng)庫(kù)技術(shù),數(shù)據(jù)倉(cāng)庫(kù)的定義,對(duì)數(shù)據(jù)倉(cāng)庫(kù)的理解數(shù)據(jù)倉(cāng)庫(kù)用于支持管理和決策,面向分析型數(shù)據(jù)處理,它不同于企業(yè)現(xiàn)有的面向交易的操作型數(shù)據(jù)庫(kù);數(shù)據(jù)倉(cāng)庫(kù)是對(duì)多個(gè)異構(gòu)的數(shù)據(jù)源有效集成,集成后按照主題進(jìn)行了重組,并包含歷史數(shù)據(jù)。數(shù)據(jù)倉(cāng)庫(kù)(DataWarehouse)是一個(gè)面向主題的(SubjectOriented)、集成的(Integrated)、相對(duì)穩(wěn)定的(Non-Volatile)、反映歷史變化(TimeVariant)的數(shù)據(jù)集合,用于支持管理決策和信息的全局共享。W.H.Inmon,面向主題的數(shù)據(jù)組織,主題:宏觀分析領(lǐng)域所涉及的分析對(duì)象采用面向事務(wù)進(jìn)行數(shù)據(jù)組織,其特點(diǎn)為:充分考慮企業(yè)的部門(mén)組織結(jié)構(gòu)和業(yè)務(wù)活動(dòng)反映企業(yè)內(nèi)部數(shù)據(jù)流動(dòng)情況,業(yè)務(wù)處理的數(shù)據(jù)流程與業(yè)務(wù)處理流程中的單據(jù)、票證、文檔有良好的對(duì)應(yīng)數(shù)據(jù)與應(yīng)用(數(shù)據(jù)的處理)有一定的對(duì)應(yīng)例:保險(xiǎn)公司:面向應(yīng)用(操作):財(cái)產(chǎn)險(xiǎn)、壽險(xiǎn)、健康險(xiǎn)、意外險(xiǎn)。面向主題的數(shù)據(jù)組織方式:在較高的層次上對(duì)分析對(duì)象的數(shù)據(jù)的一個(gè)完整、一致的描述。例:保險(xiǎn)公司:面向主題:客戶、保單、保費(fèi)、理賠(賠款)。,面向主題數(shù)據(jù)組織的實(shí)現(xiàn)舉例,多個(gè)表,面向主題數(shù)據(jù)組織的實(shí)現(xiàn)舉例(續(xù)一),面向主題數(shù)據(jù)組織的實(shí)現(xiàn)舉例(續(xù)二),數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn):集成的,操作型數(shù)據(jù)庫(kù)面向特殊應(yīng)用每一個(gè)數(shù)據(jù)庫(kù)面向特定的應(yīng)用,各類(lèi)應(yīng)用(包括其相關(guān)的數(shù)據(jù)庫(kù))之間相互獨(dú)立。系統(tǒng)的發(fā)展經(jīng)歷一個(gè)長(zhǎng)期的過(guò)程數(shù)據(jù)倉(cāng)庫(kù)集成的數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)從建立時(shí)開(kāi)始,面向整個(gè)企業(yè)的分析處理,數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)是已經(jīng)集成了的,消除了數(shù)據(jù)的不一致性.在某個(gè)時(shí)間點(diǎn)完成設(shè)計(jì),實(shí)現(xiàn)需要經(jīng)歷一個(gè)長(zhǎng)期的不斷迭代的過(guò)程,數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn):集成的,消除沖突:不一致,同名異義、異名同義、單位不統(tǒng)一等等,需要進(jìn)行數(shù)據(jù)清理(因?yàn)閬?lái)源于不同的子系統(tǒng),與不同的主要邏輯捆綁)數(shù)據(jù)的綜合和計(jì)算:可在抽取數(shù)據(jù)時(shí);也可在進(jìn)入DW以后。,數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn):相對(duì)穩(wěn)定的,數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn):相對(duì)穩(wěn)定的,一般不修改,只追加;過(guò)期限的數(shù)據(jù)可從DW中移走(刪去);對(duì)DW,主要是查詢,DWMS比DBMS要簡(jiǎn)單可不考慮并發(fā)控制要考慮性能(因?yàn)椴樵償?shù)據(jù)量大)和界面友好(對(duì)高層管理者),數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn):反映歷史變化,數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn):反映歷史變化,碼鍵包含時(shí)間項(xiàng)不斷增加新的數(shù)據(jù)內(nèi)容;刪去過(guò)時(shí)的數(shù)據(jù);例如:超過(guò)10年的數(shù)據(jù)與時(shí)間有關(guān)的綜合數(shù)據(jù):隨時(shí)間變化而重新組合,數(shù)據(jù)倉(cāng)庫(kù)的特點(diǎn):反映歷史變化,操作型數(shù)據(jù)與DW中的數(shù)據(jù)比較操作型環(huán)境60-90天數(shù)據(jù)記錄能被更新碼中不一定包括時(shí)間元素?cái)?shù)據(jù)倉(cāng)庫(kù)5-10年數(shù)據(jù)數(shù)據(jù)的復(fù)雜快照碼中包括時(shí)間元素,第一章數(shù)據(jù)倉(cāng)庫(kù)基本概念,數(shù)據(jù)倉(cāng)庫(kù)技術(shù)產(chǎn)生的背景什么是數(shù)據(jù)倉(cāng)庫(kù)技術(shù),數(shù)據(jù)庫(kù)技術(shù)與數(shù)據(jù)倉(cāng)庫(kù)技術(shù),數(shù)據(jù)庫(kù)技術(shù)在系統(tǒng)功能和性能需求強(qiáng)調(diào)的是多用戶環(huán)境下如何針對(duì)并發(fā)用戶的增刪改操作,保證數(shù)據(jù)的一致性和可恢復(fù)性,并發(fā)用戶的吞吐量為數(shù)據(jù)庫(kù)管理系統(tǒng)的重要性能指標(biāo)數(shù)據(jù)倉(cāng)庫(kù)技術(shù)在系統(tǒng)功能和性能需求強(qiáng)調(diào)的是大數(shù)據(jù)量環(huán)境下的高效、快速查詢,查詢的吞吐量為數(shù)據(jù)倉(cāng)庫(kù)管理系統(tǒng)的重要性能指標(biāo),

注意事項(xiàng)

本文(數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘技術(shù)概述.ppt)為本站會(huì)員(max****ui)主動(dòng)上傳,裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。 若此文所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng)(點(diǎn)擊聯(lián)系客服),我們立即給予刪除!

溫馨提示:如果因?yàn)榫W(wǎng)速或其他原因下載失敗請(qǐng)重新下載,重復(fù)下載不扣分。




關(guān)于我們 - 網(wǎng)站聲明 - 網(wǎng)站地圖 - 資源地圖 - 友情鏈接 - 網(wǎng)站客服 - 聯(lián)系我們

copyright@ 2023-2025  zhuangpeitu.com 裝配圖網(wǎng)版權(quán)所有   聯(lián)系電話:18123376007

備案號(hào):ICP2024067431號(hào)-1 川公網(wǎng)安備51140202000466號(hào)


本站為文檔C2C交易模式,即用戶上傳的文檔直接被用戶下載,本站只是中間服務(wù)平臺(tái),本站所有文檔下載所得的收益歸上傳人(含作者)所有。裝配圖網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)上載內(nèi)容本身不做任何修改或編輯。若文檔所含內(nèi)容侵犯了您的版權(quán)或隱私,請(qǐng)立即通知裝配圖網(wǎng),我們立即給予刪除!