《最小二乘法與回歸分析.ppt》由會(huì)員分享,可在線閱讀,更多相關(guān)《最小二乘法與回歸分析.ppt(20頁(yè)珍藏版)》請(qǐng)?jiān)谘b配圖網(wǎng)上搜索。
1、5化學(xué)計(jì)量學(xué)方法,6.1引言6.2線性回歸分析6.3化學(xué)因子分析6.4人工神經(jīng)網(wǎng)絡(luò)6.5小波分析6.6獨(dú)立成分分析6.7支持向量機(jī)分類(lèi)與回歸,本課程的教學(xué)內(nèi)容,最小二乘法與回歸分析化學(xué)因子分析人工神經(jīng)網(wǎng)絡(luò)小波分析獨(dú)立成分分析支持向量機(jī)分類(lèi)與回歸分析,5.2回歸分析及檢驗(yàn),回歸分析是研究隨機(jī)現(xiàn)象中變量之間關(guān)系的一種數(shù)理統(tǒng)計(jì)方法,它在生產(chǎn)實(shí)踐和科學(xué)研究及實(shí)驗(yàn)中有著廣泛的應(yīng)用。目前在尋找經(jīng)驗(yàn)公式,探索新配方,制定新標(biāo)準(zhǔn),預(yù)言效果等方面都已取得不少成績(jī)。在科學(xué)研究及生產(chǎn)實(shí)驗(yàn)中,常常會(huì)遇到在同一個(gè)事物中有多個(gè)變量存在,而且它們相互關(guān)聯(lián),相互制約。這種關(guān)聯(lián)和制約表明它們之間客觀存在一定數(shù)學(xué)的或其他的關(guān)系。
2、但要找出它們之間數(shù)學(xué)關(guān)系的數(shù)學(xué)解析式是非常困難的,有時(shí)是不可能的。因此需要用數(shù)量統(tǒng)計(jì)的方法,在大量的試驗(yàn)中,尋找出隱藏在各變量間的統(tǒng)計(jì)規(guī)律性或近似的數(shù)學(xué)模型,這種關(guān)系稱(chēng)之謂回歸關(guān)系。有回歸關(guān)系的計(jì)算方法及理論叫做回歸分析。,回歸分析的主要內(nèi)容,從一組數(shù)據(jù)出發(fā),確定這些變量間的定量關(guān)系式;對(duì)這些關(guān)系的可信度進(jìn)行統(tǒng)計(jì)檢驗(yàn);尋找某一個(gè)應(yīng)變量和哪些自變量有關(guān),其影響程度如何;利用上述關(guān)系,進(jìn)行預(yù)報(bào)和控制;選擇較少的試驗(yàn)點(diǎn),獲得更多的信息,對(duì)試驗(yàn)進(jìn)行較好的設(shè)計(jì)。,,5.2.1最小二乘法原理,設(shè)實(shí)測(cè)數(shù)據(jù)為(xi,yi)(i=1,2,…,n),其近似符合函數(shù)y=φ(x,a1,a2,…,am)(n>m;a1,
3、a2,…,am是待定系數(shù))當(dāng)用測(cè)定值x=xi(i=1,2,…,n)代入(4.6-1)可計(jì)算出y值,記作,,,不要求近似函數(shù)通過(guò)全部觀測(cè)點(diǎn),計(jì)算值與實(shí)測(cè)值不一定完全相等,之間的差稱(chēng)為殘差,殘差的大小是衡量待定參數(shù)a1,a2,…,am好壞的重要標(biāo)志。,如何確定殘差?,,殘差和殘差絕對(duì)值和殘差平方和,這樣問(wèn)題就歸納為求多元函數(shù)Q(a1,a2,…,am)極小值點(diǎn),,,,…,解此方程即得參數(shù)aj(j=1,2,…,m)近似函數(shù)y=φ(x,a1,a2,…,am)這就是曲線擬合的最小二乘法原理。,應(yīng)用舉例-1,問(wèn)題:改變某有色有機(jī)酸H2L的溶液的pH,測(cè)得溶液的吸光度A,計(jì)算該有機(jī)酸的離解常數(shù)Ka1,Ka2。
4、解:根據(jù)吸光度的加和性可得:A=AH2L+AHL+AL將它們用[H+]及Ka1、Ka2表示,則有,AH2L、AHL和AL為溶液全部以H2L、HL-或L2-形式存在時(shí)的吸光度。其中AH2L和AL都可由實(shí)驗(yàn)直接測(cè)定,因?yàn)樵谧銐蚋叩乃岫认?,有機(jī)酸將全部以H2L形式存在,這時(shí)溶液的吸光度即AH2L;同理,在足夠高的pH值時(shí),測(cè)得的吸光度為AL。所以只剩下AHL不易測(cè)準(zhǔn)。,令y=(AH2L-A)[H+]2,x1=A[H+],x2=A-AL,x3=-[H+],Ka1=a1,Ka1Ka2=a2,AHLKa1=a3,這是三元一次方程組,理論上講只要測(cè)得三組數(shù)據(jù)(pH1,A1),(pH2,A2)和(pH3,A3
5、),就可以解出三元一次方程組,算出a1,a2和a3。但是在實(shí)驗(yàn)中,常常帶有實(shí)驗(yàn)誤差,只憑三組測(cè)量值進(jìn)行計(jì)算會(huì)使結(jié)果很不可靠,所以,通常要測(cè)量許多組實(shí)驗(yàn)數(shù)據(jù)pH1,A1pH2,A2;pH3A3;…;pHn,An,得到n個(gè)方程,因?yàn)閚>>3,該方程組為矛盾方程組,可用最小二乘法求解。,,上機(jī)作業(yè),用光度法測(cè)定間苯二酚的離解常數(shù)Ka1,Ka2,測(cè)得溶液的pH和A的數(shù)據(jù)如下:──────────────────────────pH2.903.003.103.203.303.403.503.603.70A0.3700.3740.3780.3820.3870.3930.3980.4030.407─────
6、─────────────────────pH4.284.384.464.544.644.724.784.854.91A0.4070.4030.3980.3930.3870.3820.3780.3740.370──────────────────────────并且測(cè)得AH2L=0.353,AL=0.337。要求:將由實(shí)驗(yàn)測(cè)定所得pH和A經(jīng)換算后得到課堂所講y,x,a等形式,編程語(yǔ)言任選;矛盾方程組求解可以編程實(shí)現(xiàn),或由統(tǒng)計(jì)軟件中的多元線性回歸分析而得;將數(shù)據(jù)預(yù)處理程序及結(jié)果、數(shù)據(jù)處理最后結(jié)果等以附件l形式交送至化學(xué)信息學(xué)網(wǎng)絡(luò)課堂.,5.2.2線性回歸分析,一元線性回歸通過(guò)一組實(shí)驗(yàn)數(shù)據(jù)進(jìn)行最小
7、二乘法回歸處理,求出直線的斜率和截矩,并根據(jù)一定的統(tǒng)計(jì)方法處理,得到較多的統(tǒng)計(jì)信息,對(duì)實(shí)驗(yàn)數(shù)據(jù)線性相關(guān)性進(jìn)行檢驗(yàn)及進(jìn)行預(yù)報(bào)等。,平均值差方和,回歸分析結(jié)果,回歸方程檢驗(yàn),相關(guān)系數(shù)總差方和(S)=剩余差方和(Q)+回歸差方和(U)│r│≤1。r越大,表示相關(guān)性越好。r>0,正相關(guān),直線的斜率為正;r32kg/mm2,延伸率y2>33%,且要求有95%的把握滿足上述要求,問(wèn)含碳量在什么范圍。合金鋼成分及性能實(shí)測(cè)數(shù)據(jù)━━━━━━━━━━━┳━━━━━━━━━━━━x(%)y1(kg/mm2)y2(%)┃x(%)y1(kg/mm2)y2(%)───────────╂────────────0.0340
8、.540.0┃0.1546.040.50.0441.534.5┃0.1648.033.00.0542.541.5┃0.1753.037.00.0643.037.5┃0.1850.036.50.0739.536.0┃0.2052.537.00.0842.040.0┃0.2156.031.00.0942.534.5┃0.2360.032.50.1043.539.0┃0.2456.032.40.1142.531.5┃0.2554.535.50.1249.041.0┃0.2661.533.30.1343.037.5┃0.2959.531.00.1449.040.0┃0.3264.032.0━━━━━━
9、━━━━━┻━━━━━━━━━━━,解將例實(shí)測(cè)數(shù)據(jù)進(jìn)行線性回歸處理得如下結(jié)果:對(duì)抗拉強(qiáng)度:回歸方程y1=85.6093x+36.02剩余標(biāo)準(zhǔn)差σ1=2.3673顯著性檢驗(yàn)F=205.7相關(guān)系數(shù)r=0.9504對(duì)延伸率:回歸方程y2=-25.1589x+39.89剩余標(biāo)準(zhǔn)差σ2=2.7970顯著性檢驗(yàn)F=12.72相關(guān)系數(shù)r=0.6050若有95%的把握滿足題中條件,則應(yīng)85.6093x+36.02+22.3673>3285.6093x+36.02-22.3673>32-25.1589x+39.89+22.770>33-25.1589x+39.89-22.770>33解之得0.0083
10、元線性回歸方程的檢驗(yàn)總差方和(S)=剩余差方和(Q)+回歸差方和(U)復(fù)相關(guān)系數(shù)方差比剩余標(biāo)準(zhǔn)偏差,S的自由度f(wàn)S=n-1U的自由度f(wàn)U=mQ的自由度f(wàn)Q=n-m-1,,,,例7N,N-二甲基-2-溴苯乙胺衍生物是腎上腺阻斷劑當(dāng)Y和Z接上不同的取代基,其生物活性是不一樣的,Y和Z取代基的結(jié)構(gòu)信息參數(shù)通常取其疏水值π和電子參數(shù)σ,其結(jié)果如下表所示。,,REGRESSMultiplelinearregressionusingleastsquares.b=REGRESS(y,X)returnsthevectorofregressioncoefficients,b,inthelinearmodely=Xb,(Xisannxpmatrix,yisthenx1vectorofobservations).,[B,BINT,R,RINT,STATS]=REGRESS(y,X,alpha)usestheinput,ALPHAtocalculate100(1-ALPHA)confidenceintervalsforBandtheresidualvector,R,inBINTandRINTrespectively.ThevectorSTATScontainstheR-squarestatisticalongwiththeFandpvaluesfortheregression.,