機(jī)器學(xué)習(xí)7周志華.ppt

上傳人：max****ui 文檔編號(hào)：22713095 上傳時(shí)間：2021-05-30 格式：PPT 頁(yè)數(shù)：23 大?。?.04MB

收藏版權(quán)申訴舉報(bào) 下載

第1頁(yè) / 共23頁(yè)

第2頁(yè) / 共23頁(yè)

第3頁(yè) / 共23頁(yè)

下載文檔到電腦，查找使用更方便

9.9 積分

下載資源

還剩頁(yè)未讀，繼續(xù)閱讀

資源描述：

《機(jī)器學(xué)習(xí)7周志華.ppt》由會(huì)員分享，可在線閱讀，更多相關(guān)《機(jī)器學(xué)習(xí)7周志華.ppt（23頁(yè)珍藏版）》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。

1、七、貝葉斯分類器貝葉斯決策論(Bayesian decision theory)概率框架下實(shí)施決策的基本理論給定 N 個(gè)類別，令 ij 代表將第 j 類樣本誤分類為第 i 類所產(chǎn)生的損失，則基于后驗(yàn)概率將樣本 x 分到第 i 類的條件風(fēng)險(xiǎn)為：貝葉斯判定準(zhǔn)則(Bayes decision rule)： h* 稱為貝葉斯最優(yōu)分類器(Bayes optimal classifier)，其總體風(fēng)險(xiǎn)稱為貝葉斯風(fēng)險(xiǎn) (Bayes risk) 反映了學(xué)習(xí)性能的理論上限判別式(discriminative)模型生成式(generative)模型建模思路：直接對(duì)代表：決策樹(shù) BP 神經(jīng)網(wǎng)絡(luò) SVM判

2、別式 vs. 生成式在現(xiàn)實(shí)中通常難以直接獲得從這個(gè)角度來(lái)看，機(jī)器學(xué)習(xí)所要實(shí)現(xiàn)的是基于有限的訓(xùn)練樣本盡可能準(zhǔn)確地估計(jì)出后驗(yàn)概率兩種基本策略：思路：先對(duì)聯(lián)合概率分布建模，再由此獲得代表：貝葉斯分類器注意：貝葉斯分類器貝葉斯學(xué)習(xí)(Bayesian learning) 貝葉斯定理根據(jù)貝葉斯定理，有先驗(yàn)概率（prior ）樣本空間中各類樣本所占的比例，可通過(guò)各類樣本出現(xiàn)的頻率估計(jì)（大數(shù)定律）證據(jù) (evidence)因子，與類別無(wú)關(guān)Thomas Bayes(1701?-1761)樣本相對(duì)于類標(biāo)記的類條件概率 (class-conditionalprobability), 亦稱似然(likelih

3、ood)主要困難在于估計(jì)似然極大似然估計(jì)先假設(shè)某種概率分布形式，再基于訓(xùn)練樣例對(duì)參數(shù)進(jìn)行估計(jì)假定具有確定的概率分布形式，且被參數(shù)唯一確定，則任務(wù)就是利用訓(xùn)練集 D 來(lái)估計(jì)參數(shù)對(duì)于訓(xùn)練集 D 中第 c 類樣本組成的集合 Dc 的似然(likelihood)為連乘易造成下溢，因此通常使用對(duì)數(shù)似然 (log-likelihood)于是，的極大似然估計(jì)為估計(jì)結(jié)果的準(zhǔn)確性嚴(yán)重依賴于所假設(shè)的概率分布形式是否符合潛在的真實(shí)分布樸素貝葉斯分類器(nave Bayes classifier)主要障礙：所有屬性上的聯(lián)合概率難以從有限訓(xùn)練樣本估計(jì)獲得組合爆炸；樣本稀疏基本思路：假定屬性相互獨(dú)立？d 為屬性數(shù)，

4、x i 為 x 在第 i 個(gè)屬性上的取值對(duì)所有類別相同，于是樸素貝葉斯分類器估計(jì) P(c): 估計(jì) P(x|c): 對(duì)離散屬性，令表示 Dc 中在第 i 個(gè)屬性上取值為xi 的樣本組成的集合，則對(duì)連續(xù)屬性，考慮概率密度函數(shù)，假定拉普拉斯修正(Laplacian correction)若某個(gè)屬性值在訓(xùn)練集中沒(méi)有與某個(gè)類同時(shí)出現(xiàn)過(guò)，則直接計(jì)算會(huì)出現(xiàn)問(wèn)題，因?yàn)楦怕蔬B乘將“抹去”其他屬性提供的信息例如，若訓(xùn)練集中未出現(xiàn)“敲聲=清脆”的好瓜，則模型在遇到“敲聲 =清脆”的測(cè)試樣本時(shí) 令 N 表示訓(xùn)練集 D 中可能的類別數(shù)，Ni 表示第 i 個(gè)屬性可能的取值數(shù) 假設(shè)了屬性值與類別的均勻分布，這是額

5、外引入的 bias 樸素貝葉斯分類器的使用若對(duì)預(yù)測(cè)速度要求高預(yù)計(jì)算所有概率估值，使用時(shí)“查表” 若數(shù)據(jù)更替頻繁不進(jìn)行任何訓(xùn)練，收到預(yù)測(cè)請(qǐng)求時(shí)再估值(懶惰學(xué)習(xí) , lazy learning) 若數(shù)據(jù)不斷增加基于現(xiàn)有估值，對(duì)新樣本涉及的概率估值進(jìn)行修正 (增量學(xué)習(xí) , incremental learning) 半樸素貝葉斯分類器樸素貝葉斯分類器的“屬性獨(dú)立性假設(shè)”在現(xiàn)實(shí)中往往難以成立半樸素貝葉斯分類器 (semi-nave Bayes classifier)基本思路：適當(dāng)考慮一部分屬性間的相互依賴信息最常用策略：獨(dú)依賴估計(jì)(One-Dependent Estimator, ODE)假

6、設(shè)每個(gè)屬性在類別之外最多僅依賴一個(gè)其他屬性 xi 的“父屬性”關(guān)鍵是如何確定父屬性兩種常見(jiàn)方法 SPODE (Super-Parent ODE)：假設(shè)所有屬性都依賴于同一屬性，稱為“超父” (Super-Parent)，然后通過(guò)交叉驗(yàn)證等模型選擇方法來(lái)確定超父屬性 TAN (Tree Augmented nave Bayes)：以屬性間的條件 ”互信息 ”(mutual information)為邊的權(quán)重，構(gòu)建完全圖，再利用最大帶權(quán)生成樹(shù)算法，僅保留強(qiáng)相關(guān)屬性間的依賴性 AODE (Averaged One-Dependent Estimator)其中是在第 i 個(gè)屬性上取值為 x i 的樣

7、本的集合，m 為閾值常數(shù)表示類別為 c 且在第 i 和第 j 個(gè)屬性上取值分別為 xi 和 xj 的樣本集合嘗試將每個(gè)屬性作為超父構(gòu)建 SPODE 將擁有足夠訓(xùn)練數(shù)據(jù)支撐的 SPODE 集成起來(lái)作為最終結(jié)果Geoff Webb澳大利亞Monash大學(xué) 高階依賴能否通過(guò)考慮屬性間的高階依賴來(lái)進(jìn)一步提升泛化性能？例如最簡(jiǎn)單的做法： ODE kDE將父屬性 pai 替換為包含 k 個(gè)屬性的集合 pai明顯障礙：隨著 k 的增加，估計(jì)所需的樣本數(shù)將以指數(shù)級(jí)增加訓(xùn)練樣本非常充分性能可能提升有限訓(xùn)練樣本高階聯(lián)合概率估計(jì)困難考慮屬性間的高階依賴，需要其他辦法貝葉斯網(wǎng) （Bayesian

8、network; Bayes network）亦稱“信念網(wǎng)” (brief network) Judea Pearl(1936 - )2011 圖靈獎(jiǎng) 有向無(wú)環(huán)圖( DAG,Directed Acyclic Graph)貝葉斯網(wǎng)結(jié)構(gòu)參數(shù)概率圖模型 (Probabilistic graphical model) 有向圖模型貝葉斯網(wǎng) 無(wú)向圖模型馬爾可夫網(wǎng) 第 14章條件概率表 ( CPT,Conditional Probability Table)1985年 J. Pearl 命名為貝葉斯網(wǎng)，為了強(qiáng)調(diào)：輸入信息的主觀本質(zhì)對(duì)貝葉斯條件的依賴性因果與證據(jù)推理的區(qū)別貝葉斯網(wǎng) （Bayesian

9、network）條件概率表 ( CPT,Conditional Probability Table)有向無(wú)環(huán)圖( DAG,Directed Acyclic Graph)給定父結(jié)點(diǎn)集，貝葉斯網(wǎng)假設(shè)每個(gè)屬性與其非后裔屬性獨(dú)立父結(jié)點(diǎn)集三變量間的典型依賴關(guān)系條件獨(dú)立性條件獨(dú)立性邊際獨(dú)立性給定 x 4, x1 與 x2 必不獨(dú)立若 x4 未知，則 x1 與 x2 獨(dú)立分析條件獨(dú)立性“有向分離”( D-separation)先將有向圖轉(zhuǎn)變?yōu)闊o(wú)向圖 V 型結(jié)構(gòu)父結(jié)點(diǎn)相連有向邊變成無(wú)向邊(根蒂)x 1 (好瓜) x 2 (甜度)x 3 (敲聲) x 4 (色澤) x5道德圖(moral grap

10、h)由圖可得：若 x 和 y 能在圖上被 z 分入兩個(gè)連通分支，則有得到條件獨(dú)立性關(guān)系之后，估計(jì)出條件概率表，就得到了最終網(wǎng)絡(luò) 結(jié)構(gòu)學(xué)習(xí)評(píng)分函數(shù)(score function)評(píng)估貝葉斯網(wǎng)與訓(xùn)練數(shù)據(jù)的契合程度常用評(píng)分函數(shù)通?；谛畔⒄摐?zhǔn)則例如最小描述長(zhǎng)度(MDL, Minimal Description Length)給定數(shù)據(jù)集 D，貝葉斯網(wǎng) AIC: BIC: 搜索最優(yōu)貝葉斯網(wǎng)絡(luò)結(jié)構(gòu)是 NP難問(wèn)題回憶“模型選擇”在 D 上的評(píng)分函數(shù)：越小越好是貝葉斯網(wǎng)的參數(shù)個(gè)數(shù)表示描述每個(gè)參數(shù) 所需的字節(jié)數(shù) 推斷推斷(inference)：基于已知屬性變量的觀測(cè)值，推測(cè)其他屬性變量的取值已知屬性變量的觀

11、測(cè)值稱為“證據(jù)” (evidence) 精確推斷：直接根據(jù)貝葉斯網(wǎng)定義的聯(lián)合概率分布來(lái)精確計(jì)算后驗(yàn)概率NP 難近似推斷：降低精度要求，在有限時(shí)間內(nèi)求得近似解常見(jiàn)做法：吉布斯采樣 (Gibbs sampling) 變分推斷 (variational inference) 吉布斯采樣隨機(jī)產(chǎn)生一個(gè)與證據(jù) E = e 一致的樣本 q0 作為初始點(diǎn)例如證據(jù) E = e：(色澤; 敲聲 ;根蒂) = (青綠 ; 濁響; 蜷縮)查詢目標(biāo) Q = q: (好瓜 ;甜度)= (是;高)隨機(jī)產(chǎn)生 q0: (否; 高) 進(jìn)行 T 次采樣，每次采樣中逐個(gè)考察每個(gè)非證據(jù)變量：假定所有其他屬性取當(dāng)前值，推斷出采樣

12、概率，然后根據(jù)該概率采樣例如：先假定色澤=青綠; 敲聲=濁響; 根蒂=蜷縮; 甜度=高，推斷出“好瓜”的采樣概率，然后采樣；假設(shè)采樣結(jié)果為“ 好瓜=是”;然后根據(jù) 色澤=青綠 ; 敲聲=濁響; 根蒂 =蜷縮;好瓜 =是，推斷出“甜度” 的采樣概率，然后采樣；假設(shè)采樣結(jié)果為“ 甜度=高”; 假定經(jīng)過(guò) T 次采樣的得到與“查詢目標(biāo)” q 一致的樣本共有 n q個(gè)，則可近似估算出后驗(yàn)概率 EM算法如何處理“未觀測(cè)到的”變量？例如，西瓜已經(jīng)脫落的根蒂，無(wú)法看出是“蜷縮”還是“堅(jiān)挺”,則訓(xùn)練樣本的“根蒂”屬性變量值未知未觀測(cè)變量隱變量(latent variable)EM(Expectation-Maximization) 算法是估計(jì)隱變量的利器做令 X 表示已觀測(cè)變量集， Z 表示隱變量集，欲對(duì)模型參數(shù)極大似然估計(jì)，則應(yīng)最大化對(duì)數(shù)似然函數(shù) Z 是隱變量，無(wú)法直接求解。怎么辦？以初始值基于為起點(diǎn)，迭代執(zhí)行以下步驟直至收斂 :推斷隱變量 Z 的期望，記為基于已觀測(cè)變量 X 和對(duì)參數(shù)做極大似然估計(jì)，記為E步 : 當(dāng)已知根據(jù)訓(xùn)練數(shù)據(jù)推斷出最優(yōu)隱變量 ZM步 : 當(dāng) Z 已知對(duì)做極大似然估計(jì)EM算法 (續(xù) )對(duì)隱變量 Z 計(jì)算期望，最大化已觀測(cè)數(shù)據(jù)的對(duì)數(shù)“邊際似然”(marginal likelihood) 前往第八站

展開(kāi)閱讀全文

溫馨提示:
1: 本站所有資源如無(wú)特殊說(shuō)明，都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等，如果需要附件，請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙，網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽，若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯，并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容，請(qǐng)與我們聯(lián)系，我們立即糾正。
7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

點(diǎn)擊下載此資源

機(jī)器學(xué)習(xí)7周志華.ppt

最新文檔

相關(guān)資源

相關(guān)搜索