《機器學習試題》由會員分享,可在線閱讀,更多相關《機器學習試題(2頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、精品文檔2歡在下載2010年春碩士研究生 機器學習 試題下列各題每個大題 10分,共8道大題,卷面總分 80分注意:在給出算法時,非標準(自己設計的)部分應給出說明。特別是自己設置的參數(shù)及變 量的意義要說明。1.下面是一個例子集。其中,三個正例,一個反例?!癙”為正例、N為反例。這些例子是關于汽車的。例子有 4個屬性,分別是“產地”、“生產商”、“顏色”、“年代”。產地生產商顏色年代|類別JapanHondaBlue1980PJapanHondaBlue1990PUSAChryslerRed1980NJapanHondaRed1980P其中:“產地”的值域為(Japan,USA)、“生產商”的
2、值域為(Honda, Chrysler)、顏色的 值域為(Blue,Red)、“年代”的值域為(1980,1990)。這里規(guī)定“假設”的形式為4個屬性值約束的合??;每個約束可以為:一個特定值(比如Japan、Blue等)、?(表示接受任意值)和(表示拒絕所有值)。例如,下面假設:(Japan, ?, Red, ?)表示日本生產的、紅色的汽車。1)根據(jù)上述提供的訓練樣例和假設表示,手動執(zhí)行候選消除算法。特別是要寫出處理 了每一個訓練樣例后變型空間的特殊和一般邊界;2)列出最后形成的變型空間中的所有假設。2 .寫出ID3算法。(要求:除標準ID3算法外,要加入“未知屬性值”和“過適合”兩種情 況的
3、處理)。3 .給出一個求最小屬性子集的算法。4.給定訓練例子集如下表。依據(jù)給定的訓練例子,使用樸素貝葉斯分類器進行分類。給定類別未知例子高度=矮,頭發(fā)=紅,眼睛=蘭,計算這個例子的類別。(計算類別時要 先列出式子,然后再代入具體的數(shù))。例子號高度頭發(fā)眼睛類別1矮淡黃蘭+2高淡黃蘭+3高紅蘭+4高淡黃褐一5矮里 八、蘭一6高里 八、蘭一7高里 八、褐一8矮紅褐一5.給定線性函數(shù) ?(x)W0W1X1wnxn及誤差定義 E 1(f(x) ?(X)22x D其中,Xi是例子x的第i個屬性值,f(x)是目標函數(shù),D是訓練例子集合。請給出一個算法, 這個算法能求出一組 Wi值,使得線性函數(shù) ?(x)逼近
4、目標函數(shù)f(x)(本題要求寫出算法的 步驟,算法步驟的詳細程度要符合書中算法的標準)。6.給定例子集(如下表),要求:1)用平面圖直觀畫出例子的分布;2)給出一種規(guī)則好壞的評判標準;3)寫出概念聚類算法。例子X1X2X3X4e10A01e20B00e30C12e41A02e51C11e62A10e72B01e82B127.簡述題1)簡述“機器發(fā)現(xiàn)”的三個定律;2) KBANN EBNN FOCL是分析學習和歸納學習結合的三個算法。簡述這三個算法與單純的 歸納學習方法相比,分別有什么區(qū)別或優(yōu)點。8.關于模式定理1)分析“選擇步”對群體遺傳的影響:令 m(s,t)是群體中模式s在時間t (或第t代
5、)的 實例數(shù)量,f(h)是個體h的適應度,f(t)是時間t (或第t代)群體中所有個體的平均適應度,n為群體中個體的總數(shù)量,U:s,t)是時間t (或第t代)群體中模式s的實例的平均適應度。在“選擇步”中,每個個體被選中的概率為Pr(h) (Pr(h)的計算見公式(1),如果共進行了 n次獨立選擇,請給出在第(t+1)代(即下一代)的群體中,模式 s 的實例存在的期望數(shù)量 Em(s,t+1)(要求給出分析過程)。Pr(h)(1)i1f(hi)2)分析“變異步”對群體遺傳的影響:令 m(s,t)是群體中模式s在時間t (或第t代)的 實例數(shù)量。設在模式 s中有R(s)個確定位,變異操作以概率Pm選擇一位并改變這位上的值。如果只考慮變異步對群體遺傳的影響,請給出在第(t+1)代(即下一代)的群體中,模式s的實例存在的期望數(shù)量Em(s,t+1)(要求給出分析過程)。