機器學(xué)習(xí)試題
精品文檔2歡在下載2010年春碩士研究生 機器學(xué)習(xí) 試題下列各題每個大題 10分,共8道大題,卷面總分 80分注意:在給出算法時,非標(biāo)準(zhǔn)(自己設(shè)計的)部分應(yīng)給出說明。特別是自己設(shè)置的參數(shù)及變 量的意義要說明。1.下面是一個例子集。其中,三個正例,一個反例?!癙”為正例、"N為反例。這些例子是關(guān)于汽車的。例子有 4個屬性,分別是“產(chǎn)地”、“生產(chǎn)商”、“顏色”、“年代”。產(chǎn)地生產(chǎn)商顏色年代|類別JapanHondaBlue1980PJapanHondaBlue1990PUSAChryslerRed1980NJapanHondaRed1980P其中:“產(chǎn)地”的值域為(Japan,USA)、“生產(chǎn)商”的值域為(Honda, Chrysler)、"顏色"的 值域為(Blue,Red)、“年代”的值域為(1980,1990)。這里規(guī)定“假設(shè)”的形式為4個屬性值約束的合??;每個約束可以為:一個特定值(比如Japan、Blue等)、?(表示接受任意值)和(表示拒絕所有值)。例如,下面假設(shè):(Japan, ?, Red, ?)表示日本生產(chǎn)的、紅色的汽車。1)根據(jù)上述提供的訓(xùn)練樣例和假設(shè)表示,手動執(zhí)行候選消除算法。特別是要寫出處理 了每一個訓(xùn)練樣例后變型空間的特殊和一般邊界;2)列出最后形成的變型空間中的所有假設(shè)。2 .寫出ID3算法。(要求:除標(biāo)準(zhǔn)ID3算法外,要加入“未知屬性值”和“過適合”兩種情 況的處理)。3 .給出一個求最小屬性子集的算法。4.給定訓(xùn)練例子集如下表。依據(jù)給定的訓(xùn)練例子,使用樸素貝葉斯分類器進(jìn)行分類。給定類別未知例子高度=矮,頭發(fā)=紅,眼睛=蘭,計算這個例子的類別。(計算類別時要 先列出式子,然后再代入具體的數(shù))。例子號高度頭發(fā)眼睛類別1矮淡黃蘭+2高淡黃蘭+3高紅蘭+4高淡黃褐一5矮里 八、蘭一6高里 八、蘭一7高里 八、褐一8矮紅褐一5.給定線性函數(shù) ?(x)W0W1X1wnxn及誤差定義 E 1(f(x) ?(X)22x D其中,Xi是例子x的第i個屬性值,f(x)是目標(biāo)函數(shù),D是訓(xùn)練例子集合。請給出一個算法, 這個算法能求出一組 Wi值,使得線性函數(shù) ?(x)逼近目標(biāo)函數(shù)f(x)(本題要求寫出算法的 步驟,算法步驟的詳細(xì)程度要符合書中算法的標(biāo)準(zhǔn))。6.給定例子集(如下表),要求:1)用平面圖直觀畫出例子的分布;2)給出一種規(guī)則好壞的評判標(biāo)準(zhǔn);3)寫出概念聚類算法。例子X1X2X3X4e10A01e20B00e30C12e41A02e51C11e62A10e72B01e82B127.簡述題1)簡述“機器發(fā)現(xiàn)”的三個定律;2) KBANN EBNN FOCL是分析學(xué)習(xí)和歸納學(xué)習(xí)結(jié)合的三個算法。簡述這三個算法與單純的 歸納學(xué)習(xí)方法相比,分別有什么區(qū)別或優(yōu)點。8.關(guān)于模式定理1)分析“選擇步”對群體遺傳的影響:令 m(s,t)是群體中模式s在時間t (或第t代)的 實例數(shù)量,f(h)是個體h的適應(yīng)度,f(t)是時間t (或第t代)群體中所有個體的平均適應(yīng)度,n為群體中個體的總數(shù)量,U:s,t)是時間t (或第t代)群體中模式s的實例的平均適應(yīng)度。在“選擇步”中,每個個體被選中的概率為Pr(h) (Pr(h)的計算見公式(1),如果共進(jìn)行了 n次獨立選擇,請給出在第(t+1)代(即下一代)的群體中,模式 s 的實例存在的期望數(shù)量 Em(s,t+1)(要求給出分析過程)。Pr(h)(1)i1f(hi)2)分析“變異步”對群體遺傳的影響:令 m(s,t)是群體中模式s在時間t (或第t代)的 實例數(shù)量。設(shè)在模式 s中有R(s)個確定位,變異操作以概率Pm選擇一位并改變這位上的值。如果只考慮變異步對群體遺傳的影響,請給出在第(t+1)代(即下一代)的群體中,模式s的實例存在的期望數(shù)量Em(s,t+1)(要求給出分析過程)。