機(jī)器學(xué)習(xí)ppt Chap02模型評(píng)估與選擇

資源ID：240470881 資源大?。?span id="ouj8hjt" class="font-tahoma">3.99MB 全文頁(yè)數(shù)：28頁(yè)
資源格式： PPT 下載積分：12積分

快捷下載

會(huì)員登錄下載

微信登錄下載

三方登錄下載：

微信掃一掃登錄

下載資源需要12積分

郵箱/手機(jī)：
溫馨提示：	用戶(hù)名和密碼都是您填寫(xiě)的郵箱或者手機(jī)號(hào)，方便查詢(xún)和重復(fù)下載（系統(tǒng)自動(dòng)生成）
支付方式：
驗(yàn)證碼：	換一換

賬號(hào)：
密碼：
驗(yàn)證碼：	換一換
當(dāng)日自動(dòng)登錄忘記密碼？

友情提示

1、下載資料失敗解決辦法

2、PDF文件下載后，可能會(huì)被瀏覽器默認(rèn)打開(kāi)，此種情況可以點(diǎn)擊瀏覽器菜單，保存網(wǎng)頁(yè)到桌面，就可以正常下載了。

3、本站不支持迅雷下載，請(qǐng)使用電腦自帶的IE瀏覽器，或者360瀏覽器、谷歌瀏覽器下載即可。

4、本站資源下載后的文檔和圖紙-無(wú)水印,預(yù)覽文檔經(jīng)過(guò)壓縮，下載后原文更清晰。

5、試題試卷類(lèi)文檔，如果標(biāo)題沒(méi)有明確說(shuō)明有答案則都視為沒(méi)有答案，請(qǐng)知曉。

網(wǎng)站客服

侵權(quán)投訴

機(jī)器學(xué)習(xí)ppt Chap02模型評(píng)估與選擇

2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程專(zhuān)用所有權(quán)保留機(jī)器學(xué)習(xí)導(dǎo)論(2016 春季學(xué)期)二、模型評(píng)估與選擇主講教師：周志華權(quán)學(xué)機(jī)16南京大保20器學(xué)習(xí)導(dǎo)論課程專(zhuān)用所有留典型的機(jī)器學(xué)習(xí)過(guò)程什么模型好？能很好地適用于unseen instance泛化能力強(qiáng)！例如，錯(cuò)誤率低、精度高然而，我們手上沒(méi)有unseen instance，權(quán)所有2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程專(zhuān)用保留泛化誤差vs.經(jīng)驗(yàn)誤差泛化誤差：在“未來(lái)”樣本上的誤差經(jīng)驗(yàn)誤差：在訓(xùn)練集上的誤差，亦稱(chēng)“訓(xùn)練誤差”泛化誤差越小越好經(jīng)驗(yàn)誤差是否越小越好？NO!因?yàn)闀?huì)出現(xiàn)“過(guò)擬合”(overfitting)2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程專(zhuān)用所有權(quán)保留過(guò)擬合(overfitting)vs.欠擬合(underfitting)2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程用專(zhuān)所有權(quán)保留模型選擇(model selection)三個(gè)關(guān)鍵問(wèn)題:如何獲得測(cè)試結(jié)果？如何評(píng)估性能優(yōu)劣？如何判斷實(shí)質(zhì)差別？評(píng)估方法性能度量比較檢驗(yàn)權(quán)專(zhuān)用2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程所有保留評(píng)估方法關(guān)鍵：怎么獲得“測(cè)試集”(test set)？測(cè)試集應(yīng)該與訓(xùn)練集“互斥”常見(jiàn)方法：留出法(hold-out)交叉驗(yàn)證法(cross validation)自助法(bootstrap)權(quán)2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程專(zhuān)用所有保留訓(xùn)練集測(cè)試集留出法擁有的數(shù)據(jù)集注意：保持?jǐn)?shù)據(jù)分布一致性（例如:分層采樣)多次重復(fù)劃分(例如:100次隨機(jī)劃分)測(cè)試集不能太大、不能太小(例如：1/51/3)2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程專(zhuān)用所有權(quán)保留k-折交叉驗(yàn)證法若k=m，則得到“留一法”(leave-one-out,LOO)權(quán)保器學(xué)習(xí)導(dǎo)論課學(xué)機(jī)2016南京大程專(zhuān)用所有留自助法基于“自助采樣”(bootsrap sampling)亦稱(chēng)“有放回采樣”、“可重復(fù)采樣”約有36.8%的樣本不出現(xiàn)訓(xùn)練集與原樣本集同規(guī)模數(shù)據(jù)分布有所改變“包外估計(jì)”(out-of-bag estimation)權(quán)專(zhuān)用2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程所有保留“調(diào)參”與最終模型算法的參數(shù)：一般由人工設(shè)定，亦稱(chēng)“超參數(shù)”模型的參數(shù)：一般由學(xué)習(xí)確定參數(shù)調(diào)得好不好對(duì)性能往往對(duì)最終性能有關(guān)鍵影響調(diào)參過(guò)程相似：先產(chǎn)生若干模型，然后基于某種評(píng)估方法進(jìn)行選擇區(qū)別：訓(xùn)練集vs.測(cè)試集vs.驗(yàn)證集(validation set)算法參數(shù)選定后，要用“訓(xùn)練集+驗(yàn)證集”重新訓(xùn)練最終模型2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程用專(zhuān)所有權(quán)保留模型選擇(model selection)三個(gè)關(guān)鍵問(wèn)題:如何獲得測(cè)試結(jié)果？如何評(píng)估性能優(yōu)劣？如何判斷實(shí)質(zhì)差別？評(píng)估方法性能度量比較檢驗(yàn)2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程專(zhuān)用所有權(quán)保留性能度量性能度量(performance measure)是衡量模型泛化能力的評(píng)價(jià)標(biāo)準(zhǔn)，反映了任務(wù)需求使用不同的性能度量往往會(huì)導(dǎo)致不同的評(píng)判結(jié)果什么樣的模型是“好”的，不僅取決于算法和數(shù)據(jù)，還取決于任務(wù)需求回歸(regression)任務(wù)常用均方誤差：2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程專(zhuān)用所有權(quán)保留錯(cuò)誤率vs.精度錯(cuò)誤率：精度：權(quán)2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程專(zhuān)用所有保留查準(zhǔn)率：查準(zhǔn)率vs.查全率查全率：權(quán)所用專(zhuān)有程課機(jī)器學(xué)習(xí)導(dǎo)論大學(xué)2016南京保留(BEP)PR圖：學(xué)習(xí)器A 優(yōu)于學(xué)習(xí)器C 學(xué)習(xí)器B 優(yōu)于學(xué)習(xí)器C 學(xué)習(xí)器A?學(xué)習(xí)器BBEP：學(xué)習(xí)器A 優(yōu)于學(xué)習(xí)器B 學(xué)習(xí)器A 優(yōu)于學(xué)習(xí)器C 學(xué)習(xí)器B 優(yōu)于學(xué)習(xí)器CPR圖,BEP根據(jù)學(xué)習(xí)器的預(yù)測(cè)結(jié)果按正例可能性大小對(duì)樣例進(jìn)行排序，并逐個(gè)把樣本作為正例進(jìn)行預(yù)測(cè)權(quán)2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程專(zhuān)用所有保留F1若對(duì)查準(zhǔn)率/查全率有不同偏好：比BEP 更常用的F1 度量：權(quán)2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程專(zhuān)用所有保留宏xx vs.微xx若能得到多個(gè)混淆矩陣:(例如多次訓(xùn)練/測(cè)試的結(jié)果，多分類(lèi)的兩兩混淆矩陣)宏(macro-)查準(zhǔn)率、查全率、F1微(micro-)查準(zhǔn)率、查全率、F1權(quán)保用導(dǎo)論課程2016南京大學(xué)機(jī)器學(xué)習(xí)專(zhuān)所有留ROC CurveROC,AUCAUC:Area Under the ROC CurveROC(Receiver OperatingCharacteristic)Curve Green&Swets,Book 66;Spackman,IWML89Area UnderThe bigger,the better權(quán)用程專(zhuān)所有2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課保留非均等代價(jià)犯不同的錯(cuò)誤往往會(huì)造成不同的損失此時(shí)需考慮“非均等代價(jià)”(unequal cost)代價(jià)敏感(cost-sensitive)錯(cuò)誤率：2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程用專(zhuān)所有權(quán)保留模型選擇(model selection)三個(gè)關(guān)鍵問(wèn)題:如何獲得測(cè)試結(jié)果？如何評(píng)估性能優(yōu)劣？如何判斷實(shí)質(zhì)差別？評(píng)估方法性能度量比較檢驗(yàn)權(quán)2016南京學(xué)機(jī)器學(xué)習(xí)導(dǎo)大論課程專(zhuān)用所有保留比較檢驗(yàn)在某種度量下取得評(píng)估結(jié)果后，是否可以直接比較以評(píng)判優(yōu)劣？NO!因?yàn)椋簻y(cè)試性能不等于泛化性能測(cè)試性能隨著測(cè)試集的變化而變化很多機(jī)器學(xué)習(xí)算法本身有一定的隨機(jī)性機(jī)器學(xué)習(xí)“概率近似正確”程專(zhuān)用所有課權(quán)學(xué)習(xí)2016南京大學(xué)機(jī)器導(dǎo)論保留(萊斯利維利昂特)(1949-)2010年圖靈獎(jiǎng)機(jī)器學(xué)習(xí)的理論基礎(chǔ)計(jì)算學(xué)習(xí)理論Computational learning theoryLeslieValiantPAC(Probably Approximately Correct)learning modelValiant,19842016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程專(zhuān)所用有權(quán)保留兩學(xué)習(xí)器比較交叉驗(yàn)證t 檢驗(yàn)(基于成對(duì)t 檢驗(yàn))k 折交叉驗(yàn)證；5x2交叉驗(yàn)證 McNemar 檢驗(yàn)(基于列聯(lián)表，卡方檢驗(yàn))多學(xué)習(xí)器比較 Friedman+Nemenyi Friedman檢驗(yàn)(基于序值，F(xiàn)檢驗(yàn);判斷”是否都相同”)Nemenyi 后續(xù)檢驗(yàn)(基于序值，進(jìn)一步判斷兩兩差別)常用方法統(tǒng)計(jì)假設(shè)檢驗(yàn)(hypothesis test)為學(xué)習(xí)器性能比較提供了重要依據(jù)統(tǒng)計(jì)顯著性2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程專(zhuān)用所有權(quán)保留Friedman 檢驗(yàn)圖橫軸為平均序值，每個(gè)算法圓點(diǎn)為其平均序值，線(xiàn)段為臨界閾值的大小若兩個(gè)算法有交疊(A 和B)，則說(shuō)明沒(méi)有顯著差別;否則有顯著差別(A 和C)，算法A 顯著優(yōu)于算法C2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程專(zhuān)用所有權(quán)保留“誤差”包含了哪些因素?換言之，從機(jī)器學(xué)習(xí)的角度看，“誤差”從何而來(lái)?2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程專(zhuān)用所有權(quán)保留偏差-方差分解(bias-variance decomposition)對(duì)回歸任務(wù)，泛化誤差可通過(guò)“偏差-方差分解”拆解為：期望輸出與真實(shí)輸出的差別同樣大小的訓(xùn)練集的變動(dòng)，所導(dǎo)致的性能變化訓(xùn)練樣本的標(biāo)記與真實(shí)標(biāo)記有區(qū)別表達(dá)了當(dāng)前任務(wù)上任何學(xué)習(xí)算法所能達(dá)到的期望泛化誤差下界泛化性能是由學(xué)習(xí)算法的能力、數(shù)據(jù)的充分性以及學(xué)習(xí)任務(wù)本身的難度共同決定2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程專(zhuān)用所有權(quán)保留偏差-方差窘境(bias-variance dillema)一般而言，偏差與方差存在沖突：訓(xùn)練不足時(shí)，學(xué)習(xí)器擬合能力不強(qiáng)，偏差主導(dǎo)隨著訓(xùn)練程度加深，學(xué)習(xí)器擬合能力逐漸增強(qiáng)，方差逐漸主導(dǎo)訓(xùn)練充足后，學(xué)習(xí)器的擬合能力很強(qiáng)，方差主導(dǎo)2016南京大學(xué)機(jī)器學(xué)習(xí)導(dǎo)論課程專(zhuān)用所有權(quán)保留前往第三站

注意事項(xiàng)

本文（機(jī)器學(xué)習(xí)ppt Chap02模型評(píng)估與選擇）為本站會(huì)員（Tomo****.明天）主動(dòng)上傳，裝配圖網(wǎng)僅提供信息存儲(chǔ)空間，僅對(duì)用戶(hù)上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理，對(duì)上載內(nèi)容本身不做任何修改或編輯。若此文所含內(nèi)容侵犯了您的版權(quán)或隱私，請(qǐng)立即通知裝配圖網(wǎng)（點(diǎn)擊聯(lián)系客服），我們立即給予刪除！

溫馨提示：如果因?yàn)榫W(wǎng)速或其他原因下載失敗請(qǐng)重新下載，重復(fù)下載不扣分。