武漢理工大學應用數(shù)理統(tǒng)計備考資料.ppt
《武漢理工大學應用數(shù)理統(tǒng)計備考資料.ppt》由會員分享,可在線閱讀,更多相關《武漢理工大學應用數(shù)理統(tǒng)計備考資料.ppt(24頁珍藏版)》請在裝配圖網(wǎng)上搜索。
應用數(shù)理統(tǒng)計 武漢理工大學數(shù)學系 楚楊杰 緒論 1 數(shù)理統(tǒng)計的發(fā)展2 數(shù)理統(tǒng)計的應用3 本課程學習內容4 成績評定方法5 參考文獻 1 數(shù)理統(tǒng)計的發(fā)展 現(xiàn)今通行的統(tǒng)計學 Statistics 一詞源出于意大利文Stato 其詞根兼有 國家 和 情況 的意義 統(tǒng)計學家 statistician 一詞源出意文statista當時理解為 處理國務的人 按這個涵義極廣的理解 統(tǒng)計學就是 國情學 這流行于16世紀的意大利 后來傳播到法 德 荷等歐陸國家 現(xiàn)代意義上使用 統(tǒng)計學 一詞的 是英國學者辛克萊 在其所著 ThestatisticalAccountofScotland1791 1799 一書中 有著作出版并對后世統(tǒng)計學發(fā)展有重大影響的 要推英國學者格朗特 他在1662年發(fā)表的 關于死亡公報的自然和政治觀察 一書 是關于描述統(tǒng)計的開山之作 有的學者甚至把此書的出版看作統(tǒng)計史的起點 1 古典統(tǒng)計 國情學 政治算術 1750 人口統(tǒng)計 政治算術 威廉 佩蒂 WillianPetty 1623 1687 是17世紀英國政治經(jīng)濟學家 建立 政治算術 即將統(tǒng)計方法應用于廣泛的社會 經(jīng)濟問題的分析 而不是只局限于人口統(tǒng)計問題 不依靠抽象的話語和看似靈巧的推理 一切讓數(shù)字說話 他的思想受到英國偉大的科學 哲學家培根 FrancisBacon 1651 1626 很大的影響 培根的實證科學思想 即主張科學理論應以實際觀察為依據(jù)并接受其檢驗 英國學者格朗特 1662年發(fā)表的 關于死亡公報的自然和政治觀察 一書 是關于描述統(tǒng)計的開山之作 格朗特的工作 在歐洲大陸也很有影響 如巴黎在1667年開始發(fā)布類似于倫敦死亡公報的材料 這方面的活動促成了在一些主要國家中建立政府統(tǒng)計部門 天文觀測 16世紀著名的丹麥天文學家第谷在長達25年的時間內對一些天體進行重復觀測以資比較 由此對觀測誤差的量級獲得了解 所得數(shù)據(jù)成為開普勒 1571 1630 日后建立行星運動定律的基礎 而這又對牛頓建立其萬有引力的學說起了極大的作用 不過 第谷和開普勒都還沒有提及建立隨機觀測誤差的概率理論的問題 但開普勒在1619年發(fā)表的著作 和諧的世界 中提出了一些建模的原則 其中有一條是 模型選擇的最終標準是其與觀察數(shù)據(jù)的符合程度 這 符合程度 的提法 蘊含了誤差概率理論的問題 偉大的天文學家伽利略 1564 1642 是第一個在其著作中提出隨機誤差這個概念 并對之有所討論的學者 他在1632年出版的著作 關于兩個主要世界系統(tǒng)的對話 托雷密和哥白尼 中提及這個問題 他是用 觀測誤差 這個名稱 他沒有提出 隨機 和 分布 這樣的概念 但他所描述的 觀測誤差 的性質 實際上即我們現(xiàn)在所理解的隨機誤差分布 他提出了以下幾點 1 所有觀測值都可以有誤差 其來源可歸因于觀測者 儀器工具以及觀測條件 3 小誤差出現(xiàn)得比大誤差更頻繁 2 觀測誤差對稱地分布在0的兩側 按 這當然假定已排除系統(tǒng)誤差的情況 并明確表明他指的是隨機誤差 2 統(tǒng)計思想與方法的形成1750 1900 在各實用領域中的學者因工作上的需要而分頭發(fā)展了一些分析數(shù)據(jù)的方法 即統(tǒng)計方法 最主要的有3個方面 天文和測地學 因誤差分析問題而發(fā)明最小二乘法和正態(tài)誤差分布 地球繞南北極的軸線自轉 因離心力的作用 地球并非一個正園球 而是略有橢度 早在18世紀初 通過恒星去確定船的緯度已有了相當?shù)木?但確定經(jīng)度的問題則更困難 土星和木星都是太陽系的大行星 由于引力而對各自的運動軌道產(chǎn)生的影響 計算其軌道是18世紀中許多天文學家和數(shù)學家關心的問題 最二乘法在19世紀初發(fā)明后 很快得到歐洲一些國家的天文和測地學工作者的廣泛使用 1837年出版的不列顛百科全書第7版 收進有關這個方法的介紹 在電子計算機出現(xiàn)以前 當參數(shù)個數(shù)較大時 計算的任務還是很繁重 1958年我國某研究所計算一個煉鐵方面的課題 涉及用最小二乘法解13個自變量的線性回歸 三十余人用電動計算機算 夜以繼日花了一個多月的時間 勒讓德 1752 9 18 1833 1 10 是法國大數(shù)學家 在數(shù)學的許多領域 包括橢園積分 數(shù)論和幾何等方面 都有重大的貢獻 最小二乘法最先出現(xiàn)在他于1805年發(fā)表的一本題為 計算慧星軌道的新方法 的著作的附錄中 美國統(tǒng)計學家斯蒂格勒認為最小二乘法之于數(shù)理統(tǒng)計學 有如微積分之于數(shù)學 不少統(tǒng)計學著作把最小二乘法的發(fā)明歸功于德國數(shù)學家高斯 但第一個公開用書面的形式發(fā)表這個方法的 是法國數(shù)學家勒讓德 時間是1805年 勒讓德的工作沒有涉及最小二乘法的誤差分析問題 1809年 高斯 1777 1855 發(fā)表了其數(shù)學和天體力學的名著 繞日天體運動的理論 此書寫了一節(jié)有關 數(shù)據(jù)結合 的問題 實際涉及的就是這個誤差分布的確定問題 高斯這項工作對后世的影響極大 它使正態(tài)分布同時有了 高斯分布 的名稱 正態(tài)分布統(tǒng)治了19世紀的統(tǒng)計學 后世之所以多將最小二乘法的發(fā)明權歸之于他 也是出于這一工作 高斯是一個偉大的數(shù)學家 重要的貢獻不勝枚舉 原德國10馬克的鈔票上印有高斯的頭像 其上還印有正態(tài)分布的密度曲線 這充分說明了高斯分布對人類科學貢獻影響影響之大 天文學家最早關心使用算術平均的合理性問題 并從誤差分布理論的角度來考察這個問題 誤差理論的基本問題是指隨機測量誤差服從怎樣的概率規(guī)律 辛普森 1710 1761 拉格朗日 1736 1813 拉普拉斯 1749 1827 等著名數(shù)學家都曾致力于尋找誤差分布的問題 但進展甚微 人口學 19世紀即開始孕育了抽樣調查的思想 這也在20世紀得到發(fā)揚光大 成為現(xiàn)今統(tǒng)計方法中的重要組成部分 魁特奈特 1796 1874比利時 是19世紀最有影響的統(tǒng)計學家之一 倡導并身體力行將正態(tài)分布用于連續(xù)性數(shù)據(jù)的分析 他的這一努力使正態(tài)分布在19世紀統(tǒng)計應用中大為流行 拉普拉斯提出 代表性抽樣 1802年 拉普拉斯受法國政府的委托 用其 比例法 通過抽樣對法國人口總數(shù)進行估計提出在國內選擇30個左右的地區(qū) 要求這些地區(qū)盡可能均勻地分布在國內 以使結果不受局部地區(qū)的特殊性的影響 凱爾在19世紀最后二十余年中領導了挪威關于全國人口和農(nóng)業(yè)的普查工作 在這段期間他發(fā)展了 代表性抽樣 的思想 所謂代表性抽樣 是指從總體中抽出的一組可代表該總體 在選定的指標上 的樣本 是一個 小型化 了的總體 生物學 特別是遺傳學 英國學者高爾頓在1874到1890年間的工作 引進了相關和回歸的思想 其重大意義在于它開創(chuàng)了分析多維數(shù)據(jù)的統(tǒng)計方法 此前的統(tǒng)計方法都是單指標性的 不能顧及指標間的相互關系 而在實用問題中一般涉及多個彼此相依的指標 孤立地分析單個指標無法得出符合實際的結論 高爾頓的工作經(jīng)過埃其渥斯 卡 皮爾遜和約爾在數(shù)學上的整理 到20世紀又經(jīng)過費歇爾等一批學者的深化 直到目前仍不失為應用統(tǒng)計方法中的主流方向之一和理論統(tǒng)計學中的精華 3 統(tǒng)計學科理論的形成約1900 1950 他在英國一個農(nóng)業(yè)試驗站工作了十多年 從事農(nóng)業(yè)試驗及其統(tǒng)計分析的研究工作 提出了用隨機的方法分配田間試驗小區(qū)的論據(jù)以及進行這種試驗設計的若干原則 其中的 劃分區(qū)組 與抽樣調查中的 分層 的思想一致 即在隨機化的設計中融入系統(tǒng)性因子的作用以降低由隨機化帶來的誤差 以費歇爾 卡皮爾遜 奈曼 歐根皮爾遜和瓦爾德等為代表的統(tǒng)計學大師建立了數(shù)理統(tǒng)計學理論框架 使數(shù)理統(tǒng)計學被承認為一門數(shù)學上嚴整的學科 1921年費歇爾發(fā)表了題為 理論統(tǒng)計學的數(shù)學基礎的論 他一般性地規(guī)定了數(shù)理統(tǒng)計學的任務為模型估計與抽樣分布 并引進了若干諸如相合性等重要概念 自此數(shù)理統(tǒng)計學問題有了統(tǒng)一的數(shù)學提法 可以說費歇爾制定的框架的基本精神一直沿用至今 奈曼在1934年發(fā)表論文 關于代表性方法的兩個不同方面 分層抽樣和目的性抽樣 在此文中奈曼對目的性抽樣從理論上作了批評 把與分層相結合的隨機抽樣建立在一個嚴格的理論基礎上 并發(fā)展了一種不依靠貝葉斯假設的估計方法 這是他發(fā)展一個全面的區(qū)間估計理論的重要一環(huán) 印度著名統(tǒng)計學家馬哈拉諾比斯對抽樣方法的理論和實踐也作出過重要的貢獻 1937年奈曼發(fā)表了關于置信區(qū)間估計的奠基性論文 這段時期其中包含了奈曼 皮爾遜假設檢驗理論的建立 1950年瓦爾德出版了 統(tǒng)計決策函數(shù) 一書 他把一切數(shù)理統(tǒng)計問題歸化為一個數(shù)學優(yōu)化問題 這一思想起源于奈曼 皮爾遜關于假設檢驗的理論 而瓦爾德將其推廣到其他領域 瓦爾德的思想對1950年以后的數(shù)理統(tǒng)計學發(fā)展起了不小的影響 且他提出的損失函數(shù)的概念溝通了統(tǒng)計方法與經(jīng)濟決策的聯(lián)系 自30年代以來 抽樣調查方法受到包括美國在內的一些國家的重視 其應用也變得經(jīng)常 戰(zhàn)后建立的聯(lián)合國 也于1947年在其統(tǒng)計司中建立了一個抽樣分委員會 發(fā)布過一些指導性文件 對抽樣調查方法在全球的應用和推廣起了很大的作用 4 統(tǒng)計理論的深化與應用1950 這個時期也是數(shù)理統(tǒng)計學走向高度數(shù)學化的時期 數(shù)理統(tǒng)計學研究內容中純數(shù)學性的內生性問題的比重大為增加 把數(shù)理統(tǒng)計學比喻為一個建筑物 則這個時期的成就在于其內部裝修一些重要的理論和方法 如極大似然估計在此前只有一個粗糙的形態(tài) 在這個時期達到數(shù)學上的嚴格化 參數(shù)估計和非參數(shù)統(tǒng)計的精細發(fā)展也到這個時期才完成 截尾數(shù)據(jù)的可靠性分析與生存分析包括時間序列分析在內的隨機過程統(tǒng)計和貝葉斯統(tǒng)計等理論的重大進展也產(chǎn)生 這個時期 另外社會經(jīng)濟的發(fā)展推動了統(tǒng)計學在各領域的廣泛應用 而計算機的發(fā)明及其普遍應用使許多需要大量繁雜的計算的統(tǒng)計方法的使用成為可能這些又反過來推動了數(shù)理統(tǒng)計學中新問題的提出和研究 2 數(shù)理統(tǒng)計的應用 大量的原始數(shù)據(jù)如果不經(jīng)過有其目的的整理 分類 排比 分析 并通過適當?shù)男问奖硎境鰜?就好比一堆沒有經(jīng)過冶煉的礦物 沒有什么用處 在生產(chǎn)實踐和科學實驗中 經(jīng)常會遇到大量的各種不同類型的數(shù)據(jù) 這些數(shù)據(jù)為我們提供了很有用的信息 它可以幫助我們認識事物的內在規(guī)律 研究事物之間的關系 預測事物的可能發(fā)展 是指導生產(chǎn)實踐和科學實驗的重要依據(jù) 原始數(shù)據(jù)中有用的信息并非一目了然 而是蘊藏在大量的數(shù)據(jù)之中 要想從這大量的數(shù)據(jù)中找到有用的信息 必須對數(shù)據(jù)進行分析整理 去偽存真 去粗取精 由表及里 抓住主要矛盾 盡可能充分地 正確地從數(shù)據(jù)中提取出有用的信息 數(shù)理統(tǒng)計學為我們分析 處理數(shù)據(jù)提供了許多有用的統(tǒng)計方法 數(shù)理統(tǒng)計學是 收集和分析帶隨機性的數(shù)據(jù)的科學和藝術 觀測得到的數(shù)據(jù)難免存在誤差 如實驗誤差 隨機誤差 系統(tǒng)誤差 過失誤差 對數(shù)據(jù)分析處理時 也會產(chǎn)生一些計算誤差 截斷誤差 舍入誤差 因誤差的普遍存在 我們有必要對誤差及含有誤差的數(shù)據(jù)處理問題進行研究 用統(tǒng)計方法解決實際問題時 首先要建立它的統(tǒng)計數(shù)學模型 也就是要把這個具體問題經(jīng)過抽象化簡 建立有關量應滿足的統(tǒng)計關系式 即制定描述這些量的統(tǒng)計數(shù)學模型 系統(tǒng) 1 系統(tǒng)參數(shù)辨識 參數(shù)估計 假設檢驗 3 系統(tǒng)輸入輸出相關分析 多元相關分析 4 決策分析 多元統(tǒng)計分析 判別分析 5 散亂數(shù)據(jù)分析 統(tǒng)計規(guī)律的挖掘 2 系統(tǒng)影響分析 方差分析 正交試驗設計 3 本課程學習內容 第一章抽樣分布第二章參數(shù)估計第三章假設檢驗第四章方差分析第五章正交試驗設計 第一部分 數(shù)理統(tǒng)計基礎 第六章線性回歸分析第七章主成分分析典型相關分析第八章因子分析 第二部分 多元線性統(tǒng)計模型 第九章判別分析第十章聚類分析 第三部分 統(tǒng)計模式識別方法 4 成績評定方法 考勤10 筆試50 論文40 筆試 其中一部分為平時作業(yè) 小論文 提前布置 統(tǒng)計方法的綜合運用 要求 結合所學專業(yè) 收集數(shù)據(jù) 編寫算法程序 格式 問題的提出 數(shù)據(jù)來源 模型建立與解釋 算法設計 實驗結果 圖表 結果分析 5 參考文獻 1 應用數(shù)理統(tǒng)計 吳翊等 國防科技大學出版1995 2 實用統(tǒng)計方法 梅長林等 科學出版社2002 3 AnalyzingMultivariateData JamesM Lattin機械工業(yè)出版社2003- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 武漢理工大學 應用 數(shù)理統(tǒng)計 備考 資料
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學習交流,未經(jīng)上傳用戶書面授權,請勿作他用。
鏈接地址:http://ioszen.com/p-7462042.html