數(shù)據(jù)處理ppt課件
《數(shù)據(jù)處理ppt課件》由會員分享,可在線閱讀,更多相關(guān)《數(shù)據(jù)處理ppt課件(56頁珍藏版)》請在裝配圖網(wǎng)上搜索。
數(shù)據(jù)處理,1,數(shù)據(jù)處理,? 測量結(jié)果的統(tǒng)計檢驗,在測量中,由于多種因素影響,使得一組測定值內(nèi)各個測定值之間,或一組測定值與另一組測定值之間存在差異。這種差異是由測定過程中的隨機因素影響造成的,還是由于固定因素的作用結(jié)果,實驗者可借助統(tǒng)計檢驗進行區(qū)分、判斷。,? 顯著性水平、置信度和置信區(qū)間,,統(tǒng)計檢驗是由樣本測定值來推斷總體的特征。 統(tǒng)計檢驗的可靠程度用顯著性水平? 和置信度P表示,P = 1??。如有一系列等精度測定值,從中任意抽取一數(shù)據(jù),該數(shù)據(jù)的值落在 ? ? 1.96 區(qū)間區(qū)間的概率為 95%。,2,為了對有限次數(shù)測量結(jié)果的平均值作出估計,英國化學家和統(tǒng)計學家W. S. Gosset提出用統(tǒng)計量 t 來進行檢驗, t 的定義為,此時隨機誤差不服從正態(tài)分布而服從 t 分布,t 值不僅隨概率而異,還與自由度 f ( f = n - 1)有關(guān)。,3,,,,在有限次測定中,只能得到 和 ,即只能用 和 分別估計 ?、? ,這樣會引入附加的不確定性。表示置信區(qū)間的 前的系數(shù)(置信系數(shù))1.96和3等必須改用 t 分布表中的臨界值 (t分布置信系數(shù))。用 代表置信系數(shù)后,測定結(jié)果可用下列通式表示。,,,已知自由度 f = n-1 和 ?(一般取 ? =0.05),由 t 分布表查得 t? 值(見實驗教材),再計算出 ,最后表示出如以上通式的測量結(jié)果。,4,在一組測定值中,常發(fā)現(xiàn)其中某個測定值明顯地比其余的測定值大得多或小得多。對于這個測定值首先必須設(shè)法探尋其出現(xiàn)的原因。在判明其是否合理之前,既不能輕意保留,亦不能隨意舍棄,必要時需做重復實驗。由于各種原因(如粗心大意等),若不能找出這個測定值的確切來源,可借助統(tǒng)計檢驗來決定取舍。,? 異常數(shù)據(jù)的剔除,5,● “4 ”檢驗,6,● 3 準則,3,3,7,合理誤差范圍的選擇: 因為誤差服從正態(tài)分布,所以大誤差出現(xiàn)的概率小, 小誤差出現(xiàn)的概率大。從這一點出發(fā), 我們可以定出一個概率的最小范圍, 凡誤差出現(xiàn)的概率超出這個范圍的, 就可以認為它不屬于隨機誤差。目前大部分選擇 3 作為合理的誤差范圍。從下述積分可知,8,隨機誤差的絕對值≤ 3 的概率為99.73 % , 而 3 的概率僅為0.27 %。這相當于在370 次測量中, 誤差3 的機會(可能性) 只有一次。平時試驗中, 測量次數(shù)一般不會超過20 次,因此誤差 3 的機會可以忽略不計。于是, 凡觀測值誤差 3 時, 可以推斷, 這種誤差已不屬于隨機誤差, 很可能有系統(tǒng)誤差或過失誤差在起作用。因此, 凡是真誤差(或殘差) 其絕對值 3 的x i 均應(yīng)舍棄。,9,,10,試驗得到15 個觀測值為(按由小到大次序) : -1.40, -0.44, -0.30, -0.24, -0.22, -0.13, -0.05, 0.06, 0.10, 0.18 , 0.20 , 0.39 , 0.48 , 0. 63 , 1.01 。試判斷x1 = -1. 40 和x15 = 1. 01 是否為異常數(shù)據(jù)。,示例:,解: 計算,,,計算| x1 - | = | -1.40 - 0.018| = 1.418 , | x15- | = | 1.01 - 0.018| = 0. 992 ; 計算 3 = 3×0.551 = 1.653 ; ④判斷:因為1.418 和0.992 均小于 3 = 1.653 , 所以x1 和x15均應(yīng)保留, 它們不是異常數(shù)據(jù)。,11,注意,3 準則較簡單,但當測量次數(shù) n ? 10時,即使存在過失誤差也可能判別不出來,因此當測量次數(shù)叫少時,幾乎不適用,當 n ? 30 時較為適宜。,12,● Grubbs 方法,Grubbs方法的理論推導嚴密,是國家標準GB4883-85推薦的較好的判別過失誤差的準則。,13,示例:,14,● t 檢驗,t 檢驗法用于測定平均值和標準值相比較,或用于不同實驗者、不同實驗方法測定的平均值之間的比較。 從統(tǒng)計觀點看,同一總體中抽出的樣本,由有限次測定值組成一組數(shù)據(jù),每組數(shù)據(jù)的平均值,盡管在數(shù)值上并不一定相等,但彼此之間的差異在給定的顯著性水平下,應(yīng)該是不顯著的。,15,對于一組測量結(jié)果的平均值與標準值(或其他文獻報道的公認值)的比較,如果t 檢驗得出的計算統(tǒng)計量 t 大于相應(yīng)自由度和顯著性水平的臨界值 t?(f) , 這表明在自由度 f 下沒有滿足平均值屬于同一總體時P[|t| t?(f)] P的假設(shè),亦即此組測量結(jié)果的平均值是不可接受的。換言之,把平均值看成屬于同一總體的假設(shè)是不正確的。引起平均值之間的差異不能僅僅歸于隨機誤差,還必有某個固定因素起作用,此時實驗者需對實驗進行重新審視,應(yīng)從實驗方法、所用儀器和試劑、實驗環(huán)境和實驗操作等方面找原因,重做實驗。,16,? 實驗數(shù)據(jù)的表達,實驗結(jié)果的表達方法主要有三種:列表法、圖解法和數(shù)學方程式法。,? 列表法,制作表格時,應(yīng)注意以下幾點。,(1)表格名稱和序號:每一表格均應(yīng)有一完整而又簡明的名稱,并加以編號,便于查閱。 (2)行名與量綱:將表格分成若干行或列,每一變量應(yīng)占表格一行,每行的第一列寫上該行變量的名稱及量綱,并把二者表示為相除的形式,如 p/Pa、c/mol·L-1、?H/kJ·mol-1、k/s-1等。因為物理量的符號本身是帶有量綱的,物理量的符號除以其量綱,即等于表中的純數(shù)字。,17,(3)有效數(shù)字:每一行所記數(shù)據(jù),應(yīng)注意其有效數(shù)字位數(shù),并將小數(shù)點對齊。 (4)表中的數(shù)據(jù)應(yīng)化為最簡單的形式表示,公共的乘方因子應(yīng)在第一欄的名稱下注明。例如,用指數(shù)來表示數(shù)據(jù)中小數(shù)點的位置,可將指數(shù)放在行名旁,但此時指數(shù)上的正負號應(yīng)異號。如HAc的電離常數(shù)1.75?10?5,則該行名可寫成:電離常數(shù)?105。 (5)原始數(shù)據(jù)可與處理結(jié)果并列在一張表上,而將處理方法和計算公式在表下注明。 (6)自變量的選擇:自變量的選擇有時有一定的伸縮性,通常選擇簡單的,例如:溫度、時間、距離等,自變量值最好是均勻地等間隔地增加的。 (7)表中某一項或全表需作特別說明時,可采用表注。,18,19,Table 2. Self-diffusion coefficients of ?-humulene in 10?10 m2?s?1 p/MPa T/K 0.1 5 10 30 50 75 100 372 7.95 7.34 6.85 5.56 4.36 3.31 2.53 324 3.38 3.04 2.82 2.22 1.64 1.18 0.837 297 1.58 1.46 1.30 0.956 0.699 0.415 0.256 274 0.681 0.625 0.558 0.364 0.222 0.158 -,有效數(shù)字,20,表格示例:,表1 醇類水溶液的表面張力(mN?m?1) 濃度/%(質(zhì)量) 物質(zhì) t/?C 5 10 20 40 60 80 100 20 62.7 59.0 50.4 38.2 33.0 27.3 22.6 甲醇 30 61.7 57.3 46.0 36.1 32.3 26.5 21.6 50 57.0 55.0 47.2 35.5 30.8 25.0 19.5 25 55.3 47.3 37.9 29.6 25.1 23.6 22.0 乙醇 40 54.9 48.2 38.1 30.3 26.2 23.4 21.4* 50 53.4 46.8 36.9 29.6 25.5 22.6 20.4*,* 濃度為96%。,21,The above Table was taken from: Liqin Cao, Liuping Chen, Xiaojuan Chen, Lihua Zuo, Zhiwei Li. Synthesis of smart core-shell polymer in supercritical carbon dioxide. Polymer, 2006, 47: 4588-4595,Table 1. Polymerization conditions for varying the initiator concentration [AIBN]a Entry AIBN/% Yield/% [?]/mL?g ?1 1 0.5 - - 2 1.0 97 920 3 2.0 97 280 4 3.8 96 200 5 8.0 96 150,a Reaction performed at 150 bar and 343 K with a reaction time of 10 h, NIPAM: 16. g, AA: 1.0g.,22,,? 圖解法,圖解法可使實驗測得的各數(shù)據(jù)間的相互關(guān)系表現(xiàn)得更為直觀,便于看出數(shù)據(jù)中的最高點和最低點、轉(zhuǎn)折點、周期性、變化速率以及兩個變量之間的其他特點。利用圖形,可以進行積分、微分、內(nèi)插或外推,從而求得所需數(shù)據(jù)。例如,借蒸氣密度的測定,外推至壓力等于零以求物質(zhì)的相對摩爾質(zhì)量。利用圖形決定某些常數(shù)和物理量,例如,測定不同溫度T下某物質(zhì)的蒸氣壓 p,根據(jù) lg(p/Pa) – (1/T)關(guān)系圖,可決定方程式 lg(p/Pa) = A/T + B 中的常數(shù)A 和 B,從還可以得出物質(zhì)的摩爾蒸發(fā)焓?vapHm。又如,對不同組成的二元金屬體系進行熱分析,可獲得二元金屬相圖,再根據(jù)相圖圖形可判斷某些合金的形式、性質(zhì)和晶形轉(zhuǎn)變等等。,23,作圖時應(yīng)注意以下技術(shù)要點。 (1)工具和坐標紙:在處理化學實驗數(shù)據(jù)時,作圖所需的工具主要有鉛筆、直尺、曲線尺、曲線板和圓規(guī)等。坐標紙用得最多的是直角坐標紙,在表達三組分體系相圖時,則常用三角坐標紙,有時也用到半對數(shù)或?qū)?shù)坐標紙。 (2)縱、橫坐標的選擇:習慣上取自變量為橫坐標,因變量為縱坐標,如某物質(zhì)的蒸氣壓p和T的關(guān)系,以蒸氣壓為縱坐標,溫度為橫坐標。但有時自變量和因變量不是絕對的,如蒸氣壓與溫度的關(guān)系,從另一角度來看,也是沸點T與壓力p的關(guān)系,此時,沸點 T為縱坐標,壓力 p為橫坐標。,24,(3)坐標范圍的選擇 ① 須恰能包括全部測量數(shù)據(jù)的有效數(shù)字或稍有余地,例如,從手冊中查得水在不同溫度下的黏度如下表所示。,25,26,甲烷在戊烷中的蒸氣分壓與其組成的關(guān)系(37.8℃),由上一張幻燈片所示數(shù)據(jù)繪制的圖,,p/p?,27,② 每小格所代表的數(shù)值,應(yīng)為1,2,或5,或者是1,2,5的10n (n為正或負整數(shù)),因為這些數(shù)值容易描點和讀出。在任何情況下,都不能用3,6,7和9這樣的數(shù)值及其10n,因為這些數(shù)值不易描點和讀出,極易造成錯誤。,③ 縱、橫坐標的長短,一般來說,要調(diào)節(jié)至曲線的大部分不太垂直或水平,這只有使縱向長度和橫向長度相差不太遠,則曲線自然就不太垂直或水平了。,28,(4)圖的精密度:作圖時,也會產(chǎn)生誤差,所以當將所得的實驗數(shù)據(jù)繪成曲線時應(yīng)考慮到作圖的誤差,使它不損害實驗數(shù)據(jù)的精密度。因此,圖中的代表點應(yīng)反映測量數(shù)據(jù)的準確度和精密度??v軸和橫軸上兩測量值的精密度相近時,可用點圓符號(⊙)作為代表點,圓心小點表示測得數(shù)據(jù)的正確值,圓的半徑表示精密度值。若同一圖上有幾組不同的測量值,則各組測量值應(yīng)用其他符號(如●,◆,▼,◎,△等)表示代表點。 (5)曲線:曲線不需通過全部數(shù)據(jù)點,只要使各點均勻分布在曲線兩側(cè)即可,這樣所有代表點離開曲線距離的平方和為最小,此即最小二乘法原理。,29,,乙醇的蒸氣壓與溫度的關(guān)系(20~100℃),(6)圖題及圖坐標的標注:每個圖應(yīng)有序號和簡明的標題(即圖題),必要時應(yīng)在圖的下方對實驗條件等作出說明。,30,The above Figure was taken from: Liuping Chen, Thomas Gro?, and Hans-Dietrich Lüdemann. Studies on Self-Diffusion of Main Components of Hop Oils. Chin. J. Chem. 2001. 19(5). 453-456,31,The above Figure was taken from: Liuping Chen, Thomas Gro?, and Hans-Dietrich Lüdemann. Studies on Self-Diffusion of Main Components of Hop Oils. Chin. J. Chem. 2001. 19(5). 453-456,32,Figure 4. Effect of pressure on intrinsic viscosity for the copolymerization of AA and PNIPAm (see Table 3 for experimental conditions).,The above Figure was taken from: Liqin Cao, Liuping Chen, Xiaojuan Chen, Lihua Zuo, Zhiwei Li. Synthesis of smart core-shell polymer in supercritical carbon dioxide. Polymer, 2006, 47: 4588-4595,33,? 數(shù)學方程式法,將實驗中各變量間的關(guān)系用函數(shù)關(guān)系式來表達。如 p = f (T),純物質(zhì)的蒸氣壓與溫度的關(guān)系;G=f (T, p),物質(zhì)的Gibbs 自由能G與溫度T 和壓力 p 的關(guān)系,等等。 這種表達方式簡單,便于微分、積分和內(nèi)插值。得到的函數(shù)關(guān)系式常稱為經(jīng)驗方程式。經(jīng)驗方程式是客觀規(guī)律的一種近似描述,是理論探討的線索和根據(jù)。經(jīng)驗方程式中的系數(shù)往往與某一物理量相對應(yīng)。如,在一定溫度范圍內(nèi)液體的飽和蒸氣壓 p 和 T 之間有下列函數(shù)關(guān)系。,,34,直線的斜率 = ??vapHm/2.303R,由此可求出物質(zhì)的摩爾蒸發(fā)焓?vapHm。對于乙醇的p-T數(shù)據(jù),其lg(p/kPa) – 103K/T圖為一直線(第30張幻燈片的圖),擬合實驗數(shù)據(jù),得直線的斜率= ?4.981K,截距 = 18.78,因此乙醇在20~100℃之間的平均蒸發(fā)焓為 ?vapHm= ? (?4.981K)?8.314J?K?1?mol?1?103 = 41.41kJ?mol?1,35,將一組實驗數(shù)據(jù)擬合成經(jīng)驗方程式的步驟如下。 (1)用實驗數(shù)據(jù)作圖,繪出曲線。 (2)根據(jù)經(jīng)驗和解析幾何原理,初步判斷經(jīng)驗公式應(yīng)有的形式(通常將所得曲線形狀與已知函數(shù)的曲線形狀比較而得出)。須指出,有時不同的數(shù)學公式能得出相似的圖形,因此通過比較,選擇適當?shù)墓綍r,不僅要注意圖形形狀,而且必須注意公式的物理意義以及是否適用于所討論的問題。 (3)通過圖形比較,選擇一種或幾種類型的經(jīng)驗公式后,可進行以下擬合:,36,通常用作圖法、平均值法和最小二乘法等三種方法來求經(jīng)驗方程式中的系數(shù) a, b, c,…,a0, a1, a2, …。 但前兩種方法用得不多,下面介紹最小二乘法。,37,最小二乘法的基本假設(shè)是殘差的平方和為最小,即所有數(shù)據(jù)點與計算得到的曲線之間偏差的平方和為最小。通常,為了數(shù)學處理方便,假定誤差只出現(xiàn)在因變量y ,且假定所有數(shù)據(jù)點都同樣可靠。,38,但 Q = min 時便可求得常數(shù) a 和 b。,,,由以上二式,可得,,,39,,,40,F 檢驗:,,F 值與相關(guān)系數(shù) R 有關(guān)。F 服從自由度為(1, n-2)的 F 分布。在給定的顯著性水平? 下,從 F 分布表查得 F?(1, n-2)。 若F F0.01(1, n-2),則稱 x 與y 之間有十分顯著的線性關(guān)系。后兩種情況說明,y 的變化主要是由于x的變化造成的。,41,從 R2 的表達式可看出,當 y 與 x 之間存在嚴格的函數(shù)關(guān)系時,所有實驗點均應(yīng)落在回歸線上,則 , , 。,42,若 x 沒有誤差或 x 的誤差比 y 的誤差小很多,則剩余標準誤差(均方根誤差) 為,,,值越小,擬合直線的精度越高。而a 和b 的均方根誤差分別為,,,43,應(yīng)用 t 分布,可進一步求得 a 和 b 的置信區(qū)間,分別為,,,44,于是,由實驗數(shù)據(jù)擬合得到的方程為:,,其顯著性水平為?。,,須注意,作為數(shù)據(jù)處理結(jié)果報告時,除了寫出擬合方程外,還應(yīng)寫明相關(guān)系數(shù)、剩余標準誤差 和顯著性水平為 ?,以表明擬合方程的顯著性。,45,下表給出了某電極相對于飽和甘汞電極的電位 E,該電位是濃度 c 的函數(shù)。,示例:,試確定-lg(c/mol?L-1)與E之間的函數(shù)關(guān)系。,46,解:作-log(c/mol?L-1) - E圖,得一直線,于是設(shè),取P=95%,應(yīng)用計算軟件可求得,,,,,查t 分布表,得 ,于是得,47,,電位與濃度之間的關(guān)系,48,,,因此,最佳擬合方程為,,49,示例:,溶質(zhì)在某種溶劑中的溶解度與溶質(zhì)分子本身的特性和結(jié)構(gòu)有關(guān),取決于溶液中粒子間的相互作用力。溶質(zhì)分子的特性可用一些參數(shù)來描述。如M. H. Abraham等人提出一組分子描述符(molecular descriptors)R,?*,?,?,Vx來表征分子的特性。,以下的實例數(shù)據(jù)和結(jié)果來自文獻。,Mortimer J. Kamlet, Ruth M. Doherty,* Michael H. Abraham, Peter W. Carr, Robert F. Doherty, and Robert W. Taft. Linear Solvation Energy Relationships. 41. Important Differences between Aqueous Solubility Relationships for Aliphatic and Aromatic Solutes. J. Phys. Chem. 1987, 91, 1996-2004,LSER=Linear Solvation Energy Relationship,50,,51,,a Values in parentheses are estimated from corresponding values for closely related compounds or by a set of parameter estimation rules which we shall publish in a forthcoming paper. b 0.10 is added to /100 of aromatic compounds. c Experimental minus calculated. d A single asterisk denotes difference of more than one standard deviation. e Taken as twice the value for the corresponding benzoic acid ester. Hydrogen bonding effects are assumed to be additive. f Estimated from dipole moment; differs from earlier estimated value.,52,The coefficient of ?* has the “proper” sign in eq 1, but is not statistically significant according to Student’s t-test, and there is no deterioration in statistical goodness of fit when the term is omitted as in,The LSER is given by,AR=芳烴,SW=水中的溶解度(25?C),KgW=溶質(zhì)氣體/水分配系數(shù)(25?C),Sg=溶質(zhì)飽和蒸氣中溶質(zhì)的摩爾濃度(25?C)。,?* 不重要,不必進入方程。問題得以簡化。,53,對于多元線性和非線性擬合,根據(jù)最小二乘法原理可導出方程中各變量系數(shù)及其置信區(qū)間、復相關(guān)系數(shù)R、F 檢驗值、剩余標準誤差的計算公式,詳細內(nèi)容可參閱有關(guān)數(shù)理統(tǒng)計和回歸分析的專著。 采用回歸分析的計算軟件,如MATLAB、SPSS、Origin等,可方便地由實驗數(shù)據(jù)擬合得到各種形式方程的參數(shù),并給出相關(guān)統(tǒng)計量和圖表。同學們可以通過實驗教材后的習題自行學習、掌握這些軟件在數(shù)據(jù)處理中的應(yīng)用。,54,示例:,某種產(chǎn)品的得率 y 與反應(yīng)溫度 x1,反應(yīng)時間表 x2 及某反應(yīng)物的濃度 x3有關(guān),現(xiàn)得如下表所示的實驗結(jié)果,設(shè)y 與x1,x2 及x3 之間成線性關(guān)系,試求它們之間的三元線性回歸方程,并判斷三因素的主次。,55,解:,,應(yīng)用Microcal Origin 軟件,可得回歸方程為,整個方程的F 檢驗值為: F=180.3。 偏回歸系數(shù)F1=54.3,對應(yīng)變量x1;F2=92.9.3,對應(yīng)變量x2; F3=393.7,對應(yīng)變量x3。y 的剩余標準誤差(方差)為0.035。 查表得:F0.01(3,4)=16.69, F0.01(1,4)=21.20。F F0.01(3,4), Fj均大于F0.01(1,4)??梢娙齻€因素的主次順序為:x3 x2 x1,即反應(yīng)物濃度 反應(yīng)時間 反應(yīng)溫度。 注意: Fj值越大,對應(yīng)的因素越重要。,56,- 1.請仔細閱讀文檔,確保文檔完整性,對于不預(yù)覽、不比對內(nèi)容而直接下載帶來的問題本站不予受理。
- 2.下載的文檔,不會出現(xiàn)我們的網(wǎng)址水印。
- 3、該文檔所得收入(下載+內(nèi)容+預(yù)覽)歸上傳者、原創(chuàng)作者;如果您是本文檔原作者,請點此認領(lǐng)!既往收益都歸您。
下載文檔到電腦,查找使用更方便
20 積分
下載 |
- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設(shè)計者僅對作品中獨創(chuàng)性部分享有著作權(quán)。
- 關(guān) 鍵 詞:
- 數(shù)據(jù)處理 ppt 課件
鏈接地址:http://ioszen.com/p-1211500.html