公交車到站時間預測方法研究畢業(yè)論文.docx
《公交車到站時間預測方法研究畢業(yè)論文.docx》由會員分享,可在線閱讀,更多相關《公交車到站時間預測方法研究畢業(yè)論文.docx(62頁珍藏版)》請在裝配圖網(wǎng)上搜索。
1、2015屆交通運輸專業(yè)畢業(yè)論文 重慶601路公交車到站時間預測方法研究摘 要:隨著中國城市化進程的快速發(fā)展,城市交通問題日益嚴重,發(fā)展城市公共交通是解決現(xiàn)代交通問題的唯一途徑。在眾多的城市公共交通方式中,常規(guī)的公共汽車仍是各個城市客運的核心力量。因此,必須從普通出行者的角度出發(fā),考慮他們的實際需求,才能更有針對性地提高運輸服務質量。美國曾針對乘客所關心的公交信息種類類進行問卷調查,調查結果顯示:公交車輛到站時間為出行者最為關心的信息之一1。所以公交車到站時間的準確發(fā)布,具有十分重要的意義。本文從大量的先進文獻中,總結了現(xiàn)有的各種公交車到站時間預測方法的特點。結合實際的跟車調查分析影響公交車到站
2、時間的各個因素,其中主要有駕駛員、車輛、道路、環(huán)境和突發(fā)因素這幾個,對可數(shù)值化分析的因素進行了篩選。建立起基于歷史數(shù)據(jù)的實時修正公交車到站時間預測模型,并利用重慶市的601路公交車的歷史GPS數(shù)據(jù)對模型進行了實例驗證。最后,分析了誤差范圍,證明得出基于歷史數(shù)據(jù)的實時公交車到站時間預測模型具有模型簡單易懂、所需數(shù)據(jù)量小、預測靈活等明顯的優(yōu)勢。關鍵詞:公交車到站時間;預測;歷史數(shù)據(jù);GPS 57Study on The Prediction Method for Arrival Time of the 601 Bus in ChongqingAbstract:With the rapid deve
3、lopment of urbanization in China, the problem of urban transportation is becoming serious, and developing urban public transport is the only way to resolve modern transportation problem . Among the numerous public transport modes, the conventional bus is the core strength of the urban passenger tran
4、sport. Therefore, must be from the perspective of an ordinary traveler, considering their actual needs, can be more targeted to improve the quality of transport services. The United States has conducted a questionnaire survey which is about the bus kind of information that passengers concern, the su
5、rvey results show that: the arrival time of the bus station is one of the most concerned information. So accurate bus arrival time of publication has very important significance.Firstly, this paper summarizes the characteristics of various existing methods to predict bus arrival time from large numb
6、er of frontier literature.Combined with the actual bus following investigation and analysis of various factors affecting bus arrival time, which is the main driver, vehicle, road, environment and sudden factors, the numerical analysis of the factors were screened. The real-time correction bus arriva
7、l time model based on historical data is established, and the model is verified by the historical GPS data of 601 bus of Chongqing city. Finally, the error range is analyzed,and the obvious advantages of real-time bus arrival time prediction model based on historical date is proved,such as simple mo
8、del,small data,flexible forecast,etc. Keywords:Bus arrival time; Forecast ; Historical data ;GPS 目 錄中文摘要IABSTRACTII1 緒論11.1研究背景11.2 研究目的及意義11.3 國內外研究現(xiàn)狀21.3.1 國外研究現(xiàn)狀21.3.2 國內研究現(xiàn)狀31.4 本文研究方法和研究內容41.5 本章小結52 到站時間影響分析與數(shù)據(jù)采集62.1 公交車到站時間影響因素分析62.1.1 路段運行時間影響因素分析72.1.2 站點滯留影響因素分析72.2 影響公交車到站主要因素篩選82.3 數(shù)據(jù)采集9
9、2.3.1 數(shù)據(jù)采集設備車載GPS92.3.2 GPS數(shù)據(jù)的傳輸102.3.3 GPS在交通領域的應用102.4 本章小結113 到站時間預測模型123 1 到站時間預測模型原始模型123.1.1 移動平均法123.1.2 指數(shù)平滑法133.1.3 回歸分析法143.2 公交車到站時間預測模型的建立183.2.1 站點運行時間預測193.2.2 站點滯留時間預測203.3 綜合預測模型213.4 公交車到站時間預測流程213.5 本章小結224 實例計算234.1 數(shù)據(jù)的預處理234.1.1缺失數(shù)據(jù)的處理234.1.2 錯誤數(shù)據(jù)的排查與更正254.2 數(shù)據(jù)的粗分析264.3 計算過程294.3
10、.1 站點運行時間的計算294.3.2 站點滯留時間的預測計算384.3.3 實時預測過程分析454.4 預測結果與誤差分析474.4.1 站點運行時間誤差分析474.4.2 站點滯留時間誤差分析484.5 本章小結505 結論與展望51致謝52參考文獻53附錄 部分GPS原始數(shù)據(jù)551 緒論1.1 研究背景在中國的各大城市中,“擁堵、事故、污染”的交通現(xiàn)狀已經(jīng)成為制約城市經(jīng)濟發(fā)展的首要問題。想要改變各大城市的這一現(xiàn)狀,實現(xiàn)城市未來的可持續(xù)發(fā)展,就必須從改善人們的出行方式抓起,切切實實大力發(fā)展城市公共交通,改善公共交通的服務質量,讓更多的人能夠從公共交通的出行當中獲取滿意的服務。常規(guī)的城市公共
11、汽車是一種極其常見的公共交通工具,它能在一定程度上滿足多種出行目的乘客的需要,它以其低廉的運價、龐大的車輛數(shù)目、較低的建設成本,成為了城市客運的“領頭羊”。盡管如此,我國的公共汽車客運的發(fā)展仍然任重道遠。就目前而言,相當部分的城市公共汽車的智能化程度較低,依然采用傳統(tǒng)的作業(yè)方式來進行運營管理,不能緊跟信息化的潮流3。這就需要建立起更加準確和完善的時間預測方法體系,以便滿足城市不斷提高的公交出行需求。1.2 研究目的及意義隨著智能交通系統(tǒng)(ITS)的快速發(fā)展,交通管理者面臨了新的挑戰(zhàn)和要求,那就是需要建立起高效、快捷、全面的信息化公交系統(tǒng)。要達到整個城市公交系統(tǒng)服務質量有所上升的目的,就必須利用
12、好智能公交車系統(tǒng),就必須能夠適時地預測公交車到站時間。這是因為公交車到站時間的準確程度在提高城市運輸服務效率方面有著不可估量的作用,它涉及乘客最切身的時間利益,對出行的及時性提出了更高的要求;同時,它又是公交公司自身對外宣傳形象的良好名片,并且可以作為高效調度的參考2。此外,公交公司為乘客提供準確的到達時間可以提高公交系統(tǒng)的整體運營效率、增強公交運輸?shù)母偁幜?,促進公共交通事業(yè)的持續(xù)發(fā)展,緩解城市交通的壓力。基于這樣的背景,本文通過查閱大量的國內外相關文獻,系統(tǒng)地分析了國內外關于公交車到站時間預測的優(yōu)秀理論,對現(xiàn)有的公交車到站時間預測方法的優(yōu)劣性和適用性有了一定的掌握。結合車載GPS裝置采集得到
13、的數(shù)據(jù),并深入公交車的每一個站點調查,掌握公交到站時間的相關規(guī)律,分析影響到站時間的影響因素 。建立起基于歷史數(shù)據(jù)的實時修正公交車到站時間預測模型。在實例計算部分,選取了重慶市601路公交車在2013年12月24日采集到的GPS數(shù)據(jù)作為原始數(shù)據(jù)帶入模型,通過對預測誤差的分析,來對基于歷史數(shù)據(jù)的實時修正公交車到站時間預測模型進行評價。全文主要是通過對歷史的GPS數(shù)據(jù)分析,來得到公交車到站時間在時間上和空間上的運行規(guī)律。通過對公交車影響因素的分析和篩選,為后期建立歷史數(shù)據(jù)到站時間預測模型建立提供必要的數(shù)據(jù)支撐,同時,對于實際數(shù)據(jù)的代入計算和誤差分析,也在一定程度上驗證了基于歷史數(shù)據(jù)的預測方法的簡單
14、易算、適合較小的數(shù)據(jù)量的優(yōu)點。1.3 國內外研究現(xiàn)狀1.3.1 國外研究現(xiàn)狀公交車到站時間的預測對于整個城市交通系統(tǒng)的作用和意義是不言而喻的,國內外的交通工程方面的專家和學者都對此作了大量的研究,國外的公交車到站時間預測技術,無論是在理論上還是在應用上,都比國內的成熟很多。就國外而言,發(fā)達國家很多城市已經(jīng)將可以預測到站時間的電子站牌普遍應用推廣,但是采用的公交車到站時間預測方法卻不盡相同。其中,舉以下案例加以說明:澳大利亞的城市悉尼市最早采用公交車到站時間預測是在其到機場的快速路上,由于在這樣的快速路上,其他的車輛和環(huán)境的不可控因素較少,所以其建立的模型也較為簡單,是一種修正過的線性化的預測方
15、法,其原始數(shù)據(jù)的來源是網(wǎng)絡旅行時間系統(tǒng)(ANTTS,Automatic Network Travel Time System)3。公交車到站時間的預測在應用在倫敦的應用情況并不是像機場高速那么簡單,而是將其應用于普通的城市干道,這樣的話其算法也不能利用簡單的線性化的預測方法,一位來自荷蘭的Edwin M.Reinhoudt和英國的S.A.Velastin巧妙地運用動態(tài)卡爾曼濾波代替?zhèn)鹘y(tǒng)靜態(tài)均值算法,使得預測精度有了明顯的上升4。Wall和Dailey采用的是卡爾曼濾波的方法和原理,利用自動汽車定位技術AVL來大致估計車輛的到站時刻。這樣的做法存在著很大的誤差,這是因為在這個過程中并沒有考慮公交
16、車輛由于上下乘客所帶來的站點滯留時間5。后來的學者的研究成果總是在不斷總結前面成果的不足中發(fā)現(xiàn)的,前面利用自動汽車定位技術由于沒有考慮因為乘客上下車所帶來的公交車延誤時間,預測結果顯得較為粗糙,Shalaby、Farhan采用了卡爾曼濾波的原理,對車輛的運行時間和站點滯留時間分別進行了估計,并利用實際采集到的信息,對該模型進行了評估6。Frechette從另外的角度出發(fā),并沒有考慮將到站時間預測應用于快速路或者普通干道,他將眼光放在了大城市里主要商務活動進行的CBD地區(qū),這樣的情況下,公交車輛所受的外界干擾信息會更多,也更加影響公交車輛的可達性。因此,在建模時,考慮的額外因素會更多,主要考慮的
17、有:交叉口當中各個方向流量的比例、轉盤數(shù)目、混合車流比例等,預測的模型是建立在Ebers算法之上的7。Khan的研究跟Frechette考慮方面很類似,同樣考慮影響車輛到站時間的眾多因素,但是由于應用的目的地是不同的,Khan考慮的因素包括了:道路的距離、交通流三參數(shù)、路途中的轉彎次數(shù)、站點數(shù)量等,結合這些因素建立起了非線性的回歸模型8。Patnaik等專家考慮到歷史的運行數(shù)據(jù)肯定對當前的運行狀態(tài)產(chǎn)生或多或少的影響,所以,在建立模型時,將歷史的站點運行時間作為影響因子來考慮,再結合當前運行路況上具體的信息建立起回歸模型9。Amer Shalaby、Ali Farhan這兩位專家通過自動車輛定位
18、技術和電力轉換公司得到的數(shù)據(jù)進行試驗,對加拿大多倫多市的公交到站時間運用VISSIM軟件進行了仿真模擬,并且得到了意想不到的結論10。此外,公交車到站時間預測技術在亞洲的日韓也取得了一定的研究成果。在韓國,專家Taehyung Park和他的團隊運用的是相對智能化的學習方法人工神經(jīng)網(wǎng)絡法來對公交車到達時間進行建模分析,并且每隔一個星期對實際值和估計值進行模型校對,以此提高預測精度11。日本研究人員的方式更顯先進,因為他們利用的是Automatic vehicle identification system(車輛自動識別系統(tǒng))來記錄當前的交通狀況,并通過查找歷史的數(shù)據(jù)庫中與當前的交通狀況最相似的
19、信息來當作當前的車輛運行時間12。1.3.2 國內研究現(xiàn)狀就目前國內而言,公交車到站時間還基本處于理論研究階段,將公交車到站時間預測應用于電子站牌的城市少之又少,一些城市的部分線路的公交車電子站牌只是發(fā)布到站的距離和站點數(shù),并沒有發(fā)布到站的具體時間。吉利大學的楊教授課題組:包括了朱中、初連羽等人,利用較多的公交站點影響因素作為模型的輸入量,通過模糊回歸的模型,做了預測軟件進行實時的交通信息預測站點運行時間,因為具有實時性,所以預測精度明顯。此外,楊教授等還將快速道的誘導裝置轉移到公交汽車上面來13。周雪梅、王磊等利用GPS等先進設備,將采集到的歷史數(shù)據(jù)作為支撐,綜合聯(lián)想到干擾到站時間預測的多個
20、因子,最終建立起以不同站點為單元的到站時間影響系統(tǒng),并利用某市的歷史數(shù)據(jù)進行了實例研究14??偟膩碚f,國內目前的到站時間預測分為兩個大的方向:一個方向是通過軟件或者先進到達交通實況采集設備,運用一定的機器學習方法來實時預測公交車輛到站時間;另外一個方向則是以歷史數(shù)據(jù)為源,考慮當前路段與歷史運行路段的關系,來建立起相關模型?,F(xiàn)有的研究成果從不同的角度建立了公交車到站時間預測模型,通過綜合地對比,不難發(fā)現(xiàn)各種模型各有其優(yōu)缺點,其適用范圍也不盡一致,現(xiàn)將各種模型的優(yōu)缺點,適用性概括如下:1、基于歷史數(shù)據(jù)的模型是這些模型當中最為簡單的一種,并且計算速度也是最快的,但是該種方法是基于歷史數(shù)據(jù)的,實時性相
21、對較差,適合郊區(qū)公路或者非高峰時期的時間預測;2、回歸預測模型也是相對較為簡單的一種,它綜合考慮影響公交車到站的各個因素,通過將各個影響因素數(shù)值化,預測站點運行時間和站點滯留時間,該方法具有很強的適用性,也相對于較簡單;3、神經(jīng)網(wǎng)絡模型是一種模仿人的神經(jīng)元的機器學習模型,它能夠處理非常復雜的非線性函數(shù)關系,通過大量的輸入數(shù)據(jù),來尋找這些數(shù)據(jù)之間的依賴關系,這是一種相對復雜的方法,因此在它預測精度較高的背后也是它的局限性,在使用神經(jīng)網(wǎng)絡模型時,常常難以確定神經(jīng)節(jié)點,并且系統(tǒng)容易造成過學習和欠學習的狀態(tài);4、卡爾曼濾波模型是一種基于遞推算法的模型,所以它的實時性是很好的,也適合處理高維問題和非平衡
22、過程,但是在預測較長路徑時,采用多步預測的精度會下降明顯,所以適合的是多路徑的時間預測;5、支持向量機是一種具有很強的學習能力的學習機,它也同樣適合復雜的線性關系,但是由于在整個過程當中,需要很大規(guī)模的數(shù)據(jù),在實際應用中很難滿足,由于其本身的模型結構太過復雜,很難準確確定核函數(shù),并且計算相當耗時,使得該方法難以大規(guī)模推廣;6、基于概率的預測模型,相較于回歸模型而言,它更加充分地考慮到了在車輛運行途中的不確定因素,但是該模型同樣需要大量的數(shù)據(jù)支撐,并且整個模型的可移植性較差,因此只是適合不確定性因素影響下的時間預測。1.4 本文研究方法和研究內容在對國內外公交車到站時間預測方法地充分理解上,本文
23、系統(tǒng)而全面地總結了目前國內外常用的各類預測方法的優(yōu)缺點、適用性,以及各種模型對原始數(shù)據(jù)的要求。結合實際的公交車跟車調查的分析,總結得出影響公交車到站時間的因素,除了常見的人、車、路的影響外,還包括在時間上是否處于高峰期、是否處于周末節(jié)假日,以及季節(jié)性、天氣等因素的影響。通過對這些因素的綜合整理,建立起基于歷史數(shù)據(jù)的實時修正公交車到站時間預測模型。最后本文以現(xiàn)有的重慶公交601路公交車在2013年12月24日上午6:00:408:50:23每隔10秒發(fā)送回來的25組公交車GPS數(shù)據(jù)為研究原始數(shù)據(jù),利用SPSS和EXCEL軟件進行原始數(shù)據(jù)的分析,分析公交車到站時間的統(tǒng)計學規(guī)律,得出公交車在時間上的
24、準確程度。獲取來的歷史GPS數(shù)據(jù)證明了基于歷史數(shù)據(jù)的實時公交車到站時間預測模型的可行性和有效性,并分析了誤差程度。全文的內容結構圖如圖1.1所示。重慶601路公交車到站時間預測方法研究圖1.1 文章內容框架圖1.5 本章小結本章是全文的緒論部分,首先闡明本研究課題是在解決城市公交擁堵,大力推行公交優(yōu)先的背景上提出來的。當下又是智能交通發(fā)展好時機,因此大力推行智能公交有著舉足輕重的意義。公交車到站時間作為乘客最為關心的信息,在提高公交車服務質量,增加公交車的吸引力等方面有著必不可少的意義。將智能公交的技術引入公交車到站時間的預測當中是一件自然的事情,因此,本文目標便是通過運用先進的智能公交手段G
25、PS定位技術,實時獲取公交車到站的原始數(shù)據(jù),為公交管理者進言獻策。2 到站時間影響分析與數(shù)據(jù)采集從乘客的角度來分析,出于以下幾種原因會關注公交到站時間:將要出行時,借助手機來查詢公交到達時間,從而選擇最優(yōu)的公交車乘坐方案;出行的途中,已經(jīng)處于公交站牌下,想要知道自己所等的目標公交車還有幾個站,還有多長時間到達,借此來緩解心中等車帶來的焦躁情緒。如果時間公交不能及時到達,好改乘出租車等其他方式的交通工具;乘客并不是當天出行,需要提前一天查詢第二天或者更久的公交車到站時間,為工作以及其他目的的出行提供時間安排的依據(jù)。綜上,公交到站時間的預測主要可以分為兩種類型:一種是短時間的到站時間預測,主要通過
26、電子站牌等形式向乘客發(fā)布,需要乘客到達公交車站才能獲取相關的信息;另一種則是長時間的到站時間預測,主要通過手機短信,車輛信息網(wǎng)站等方式發(fā)布,它不需要乘客一定要到達公交車站,直接在家就能獲取相關信息。相對于短時間的到站時間預測而言,長時間的到站時間預測需要更大的數(shù)據(jù)支撐,存在的不可控因素也更多,因此,長時間的公交車到站時間預測的精度更低。由于數(shù)據(jù)有限,本文研究的方面不可能做到全面,因此主要研究的是短時間的到站時間預測。2.1 公交車到站時間影響因素分析公交車輛的運行過程受多種因素的影響,到站時間同樣是一個或多或少帶有突變和隨機因素的一個過程。交通工程學告訴我們需要從人、車、路、交通環(huán)境四個方面來
27、分析交通事件。就公交車運行的整個過程的時間組成而言,公交車的到站時間顯然是由車輛的路途運行時間和公交車站點的滯留時間這兩個部分組成。因此在分析影響公交到站時間的因素時,應該分別從這兩個方面來著手。假設要預測公交車在運行至i站點的時間,可以用下面的模型:Ai=1i-1Di 2iRi (2iN) (2.1)Di=Li-Ai (2.2)其中: Ai表示公交車在i站點的到站時間; Di 表示公交車在i站點的站點滯留時間; Li表示公交車在i站點的離站時間; Ri表示公交車以i站點為終點的路段運行時間。2.1.1 路段運行時間影響因素分析道路運行時間影響因素可以根據(jù)前文提到的總體分析思路分為人的因素、車
28、輛的影響因素、道路的影響因素和環(huán)境的影響因素。(1)人的影響因素主要包括駕駛員的年齡,性別 ,駕齡,以及反應快慢等方面;(2)車輛的影響因素車輛的起步,爬坡和制動性能等。(3)道路的影響因素包括道路通行能力,車道數(shù),道路等級情況,以及途中經(jīng)過路段是否強制限速,有無紅綠燈、交叉口、轉盤等。(4)環(huán)境的影響因素主要有天氣情況、是否為周末和節(jié)假日、以及突發(fā)因素如車禍等突發(fā)因素可能造成的影響。2.1.2 站點滯留影響因素分析所謂的站點滯留時間,通俗地講便是不管何種原因,公交車輛在每一個站點耽誤了多長時間沒有行駛。由于目前重慶的公交車均使用公交車專用道,所以影響公交車的站點滯留時間因素主要有:公交車輛進
29、出站的排隊等待時間、便道行為延誤時間、公交車輛的車門數(shù)、上下車乘客的方式和人數(shù),上車乘客車費的支付方式等方面。一般認為,公交車第i個站點的站點滯留時間主要由上下車乘客人數(shù)來決定15。通??赏ㄟ^如下公式的線性模型來表示16:(1)單車門的情況Di=b+B*Bi+A*Ai , &Bi0或Ai00, Bi=Ai=0& (2.3)(2)雙車門的情況Di=b+max(B*Bi,A*Ai), Bi0或 Ai0&0, Bi=Ai=0 (2.4)其中:Di表示公交車輛第i個站點開關門時間及其他損失時間;B、A分別表示公交車輛在第i個站點的平均乘客上、下車時間;Bi表示公交車輛在第i個站點的上車乘客數(shù);Ai表示
30、公交車輛在第i個站點的下車乘客數(shù)。2.2 影響公交車到站主要因素篩選由前面的分析不難知道,影響公交車到站的因素較多,現(xiàn)將能夠用于建模和數(shù)值化的并不是全部的影響因子,各種可以數(shù)值化的影響因素如表2.1所示。表2.1 各種影響因素統(tǒng)計表因素名稱 量化方式站點運行時間道路因素 道路等級 通行能力路段長度有無交叉口紅綠燈車輛的因素 車輛的轉彎次數(shù)車輛的時間平均速度人的因素 駕駛員的駕齡性別環(huán)境因素車道數(shù) 是否為高峰期續(xù)表2.1因素名稱 量化方式站點滯留影響因素時間因素 是否為節(jié)假日車輛進出站是否排隊等待 進出站平均等待時間車輛在站點的開門關次數(shù) 開關門時間上下車客流量 上下車人數(shù)乘客付款方式 人均付款
31、時間在具體地分析時,不可能將每一個因素都一一考慮到,所以應該根據(jù)預測方法的實際需要,選擇主要影響因素,拋棄次要因素。本文的預測目標是能根據(jù)歷史的GPS數(shù)據(jù),假設已知車輛某時刻處于某個位置,預測其到達后續(xù)某個站點的時間,并根據(jù)前續(xù)站點的實際到達時間和實際站點滯留時間來對到達的時刻進行實時地修正。就這個目的而言,本文采基于歷史數(shù)據(jù)的二元線性回歸、二次移動平均、二次指數(shù)平滑這三種預測方法是具有現(xiàn)實意義的。由于在當天的歷史數(shù)據(jù)中,以上分析的各個影響因素均是相同的,如果將影響因素作為預測模型的變量輸入則不具有參考性。2.3 數(shù)據(jù)采集實驗的所有數(shù)據(jù)均來源于重慶公交車載GPS監(jiān)控系統(tǒng),該系統(tǒng)有兩個方面的功能
32、,分別是定位和控制??刂撇糠值墓δ苤饕怯砂惭b在車上的接收設備、無線網(wǎng)絡、控制中心、監(jiān)控平臺這幾個部分來實現(xiàn)的。2.3.1 數(shù)據(jù)采集設備車載GPS本文利用數(shù)據(jù)采集設備是公交車載 GPS終端。獲得主要是所研究的601路公交車在2013年12月24日的上午6::00:40到8:50:23發(fā)車的25個班次每個班次每隔十秒反饋回來的經(jīng)緯度、速度、方向角、路途時間、站點滯留時間等信息。GPS采集數(shù)據(jù)比起傳統(tǒng)的人工調查具有精度更高、實時性更強、便于統(tǒng)計分析等優(yōu)勢。如圖2.1是GPS設備采集回來的部分數(shù)據(jù)。車載裝有GPS接收機是進行GPS定位的前提條件,公交車的GPS接收機是屬于導航型的GPS接收機,采用C
33、A碼偽距測量17。公交車車載GPS 接收機主要由天線變頻器、信號通道、微處理器、存貯器、顯示器和電源組成18。2.3.2 GPS數(shù)據(jù)的傳輸GPS 系統(tǒng)的用戶是隱蔽的,因為它是單向信息的傳輸系統(tǒng),用戶只能接受而不能發(fā)射信號20。圖2.1 GPS采集回的部分數(shù)據(jù)2.3.3 GPS在交通領域的應用GPS 在車輛導航監(jiān)控方面的應用利用GPS進行車輛監(jiān)控和調度可以充分利用計算機進行自動化、智能化的監(jiān)控管理,能迅速處理分析大批量數(shù)據(jù),大大減少了人為誤差及管理人員的工作量。隨著計算機和通信技術的發(fā)展,使得實現(xiàn)城市公交車輛定位系統(tǒng)成為可能,并可建立起統(tǒng)一的公交車輛管理系統(tǒng),對公交車輛進行統(tǒng)一的調度,實現(xiàn)科學、
34、經(jīng)濟的運營管理模式19。GPS 在交通規(guī)劃領域的應用1)GPS在交通數(shù)據(jù)采集管理中的應用 就現(xiàn)實而言,重慶市主城的大部分公交車輛已經(jīng)實現(xiàn)GPS設備的裝配,該GPS以每隔10秒的間隔向終端發(fā)送信息段。這為車輛的監(jiān)控管理提供了很大的便利。1)GPS與地理信息系統(tǒng)GIS的結合 二者的結合本就是一項新技術的突破,GIS讓GPS增強了空間概念,讓傳輸回來的數(shù)據(jù)更具有參考價值,更具有實用性。3)GPS與交通規(guī)劃在交通工程學中,無時無刻不需要獲取道路上交通量、交通密度、交通速度這三個方面的參數(shù),人工調查存在著諸多的問題,不僅耗費大量人力物力,還只能獲得較低的準確率。而GPS系統(tǒng)恰好能完美地填補這一空白,讓獲
35、取交通流的這三個參數(shù)變得簡單易得,同時也減少了由于傳統(tǒng)調查帶來的諸多問題,讓實時的路況播報成為可能。2.4 本章小結本章系統(tǒng)分析了影響公交車到站時間的影響因素,包括了交通工程學當中給出的人、車、路、交通環(huán)境以及突發(fā)事故這幾個方面的內容。通過對可數(shù)值化影響因素的篩選,使得在分析到站之間預測問題上更加具有邏輯性。由于數(shù)據(jù)的局限性,本文的GPS數(shù)據(jù)只是在同一天的同一時段上得到的,如果選擇路段距離、天氣因素、是否為節(jié)假日因素等作為預測模型的輸入變量,則不具有對比性。所以本文考慮以歷史的數(shù)據(jù)作為輸入來建立公交車到站時間預測模型。3 到站時間預測模型將得到的公交車歷史數(shù)據(jù)進行簡單的分析,就很容易發(fā)現(xiàn)其到站
36、時間存在著時間上和空間上的變化特性。在時間上,后續(xù)發(fā)車班次的到站時間深受前續(xù)站點到站時間的影響;在空間上,后續(xù)站點的到站時間深受前續(xù)站點的到站時間的影響。根據(jù)這樣的規(guī)律,采用基于時間序列分析為原始模型并根據(jù)前續(xù)站點實際到站時間為依據(jù)的公交車到站時間預測模型。3.1 到站時間預測模型原始模型所謂時間序列分析法,就是將同一變量的一組樣本值,以序列順序排成一列,這是因為其發(fā)展具有一定規(guī)律。該方法的基礎便是時序上的先后順序,運用一定的方法使其向外延伸。該種方法在的一個優(yōu)點便是預測值在很大程度上不以人的意志為轉移,操作起來也很方便,所用價格也很低廉;任何事物都要一分為二地來看待,它的缺點歸納起來便是準確
37、程度有待提高、可移植性不強,只適用于短時預測。這里對本文將要應用到的移動平均法和指數(shù)平滑法這兩種方法作一定的介紹,對于時間序列的其他方法這里不作累述。3.1.1 移動平均法顧名思義,移動平均法,并不是簡單地求取數(shù)列的平均值,而是按照時間序列的順序,依次求取平均值,以此來不斷更新均值,好比是要預測第4個時序的值,先求取第1個和第2個時序的值的均值A,在利用這個均值A和第3個時序的值求取均值便是第4個時序的預測值了。這樣的一個逐漸平均化的過程,能在一定程度上避免了一次性求取平均值帶來的突變化的風險。這個逐漸平均化的過程,在模型上表現(xiàn)為:設有一時間序列y1、y2、y3、y4yt按照時序在表格中依次排
38、出來,求出N個點的平均值,首次得到的移動均值為:Mt(1)=yt+yt-1+yt-N+1N=Mt-1(1)+ytyt-NN (3.1)其中:yt為第t 周期的樣本值;N 為移動平均的項。從上面的公式可以很清楚地得到,當時序每向后面移動一次,就與移動的新數(shù)據(jù)結合成為均值,而又將前面經(jīng)過的數(shù)據(jù)摒棄掉,這樣不斷地“接受與舍棄”的過程,能夠使時序中的每個值向前移動,使其達到逐漸平均化的目的。3.1.2 指數(shù)平滑法指數(shù)平滑法的目的與前面的移動平均法相類似,都是旨在一定程度上消除不可控因素的干擾,需要區(qū)別來看的是,指數(shù)平滑法不需要保存大量的數(shù)據(jù),只要能夠獲取當前批次樣本的真實值和預測值,就能預測就近的下個
39、批次數(shù)據(jù)的值。指數(shù)平滑的分類主要為兩類,一次平滑和多次平滑,這里只是介紹多次平滑當中的二次平滑。一次平滑法設有一時間序列y1、y2、y3、y4yt則一次指數(shù)平滑的公式為:St(1)=yt+(1-)St-1(1) (3.2)其中:St(1)為第 t周期的一次指數(shù)平滑值;為系數(shù),0t,則回歸系數(shù)顯著。5)進行預測如果觀測值的數(shù)據(jù)量較小,近似的置信區(qū)間的常用公式為:置信區(qū)間=yTse (3.15)多元線性回歸在現(xiàn)實生活中,社會生活的各個方面總是有著千絲萬縷地聯(lián)系,同樣一個結果,可能是由多個因素共同導致的。在這點上,一元回歸的應用顯得有些局限,因此誕生了多元線性回歸。多元線性回歸預測的原理跟一元線性回
40、歸相同,只是選取的變量不再是一個,至少兩個及其以上。先以簡單的二元線性回歸為例來講解。1)二元線性回歸模型:y=a+b1x1+b2x2 (3.16)2)擬合優(yōu)度指標:標準誤差,是對y值和預測值之間的離差的度量。其計算公式為:SE=(y-y)2n-3 (3.17)可決系數(shù):R2=1-(y-y)2(y-y)2 (3.18)R20.96意味著回歸模型對自變量的全部變差做出解釋。3)置信范圍置信區(qū)間的公式為:置信區(qū)間:ytpSE (3.19)其中:tp 是自由度為n-k的t 統(tǒng)計量數(shù)值表中的數(shù)值; n 是觀察值的個數(shù); k 是包括因變量在內的變量的個數(shù)。4)自相關和多重共線性問題自相關檢驗:D-W=i
41、=2n(i-i=1)2i=1ni2 (3.20)其中:i=yi-yi (3.21)多重共線性檢驗:在預測的過程當中,建立回歸模型時是假設各個已知數(shù)之間是彼此無關的,但是在實際中,這種假設可能是謬論,并且會使人信以為真而建立起錯誤的方程。為了避免類似問題的發(fā)生,應該對不同的已知參量之間的關系進行檢驗。任何兩個自變量之間的相關系數(shù)為:r=(x-x)(y-y)(x-x)2(y-y)2 (3.22)通常認為自變量之間存在多重線性關系的條件是相關系數(shù)的絕對值大于0.25或者0.5.3.2 公交車到站時間預測模型的建立本文的公交車到站時間預測模型是在基于當天的歷史數(shù)據(jù)基礎上建立起來的,因為數(shù)據(jù)的有限性,不
42、可能將影響公交車到站時間的駕駛員因素、公交車因素、道路條件因素、突發(fā)狀況等可以直接量化的影響因素作為模型的輸入變量。因為是在同一天的相同時段,以上因素基本都是相同的,所以不具有參考性和對比性。采用歷史的數(shù)據(jù)作為模型的輸入變量,能夠反映歷史的公交車到站時間影響因素對于實際到站時間的影響程度,這個影響程度又可以通過預測模型間接地反映到當前的公交車到站時間上來。所以本文建立的基于歷史數(shù)據(jù)的實時公交車到站時間預測模型為:AN=Bi+TN-i (3.23)其中:AN表示第y班次的公交車到達第N個站點需要的時間; Bi表示該公交車距離就近的站點所需要的運行時間;TN-i表示該公交車從i站點到N站點總共的運
43、行時間;TN-i=n=iN-1Dn+n=i+1NTn (3.24)其中:Dn表示第n個站的站點滯留時間;Tn表示第n個站的運行時間;合并以上兩式:AN=Bi+n=iN-1Dn+n=i+1NTn (3.25)在計算過程當中,為了將模型簡化,使計算更加方便,假設公交車剛好處在某個站點上,則Bi取0,上式變?yōu)椋篈N=n=iN-1Dn+n=i+1NTn (3.26)在模型的實際運用當中,為了使預測精度更高,使預測更具有實時性,則以公交車每到達一個站點為基準點,將當前車次的數(shù)據(jù)帶入模型中,繼續(xù)預測的后續(xù)站點的到站時間,以此類推,反復迭代。以此反復地對首次的預測時間進行修正。簡而言之,假設車輛從站點i出發(fā)
44、,運用以下公式:AN=n=iN-1Dn+n=i+1NTn (3.27)設第一次求得的AN為q,當車輛運行出i站時,用第i個站的實際站點滯留Di1代替預測值Di,則可以算出相對于q更加精確的q1;當車輛運行到達就近的站點i+1時,用車輛運行到i+1站點的實際運行時間Ti+11用來替代之前的Ti+1,再帶入公式中,則可以計算出相對精確的q2來代替q1;依次向后續(xù)的站點推移,不斷提高AN的實時性和精確性。3.2.1 站點運行時間預測根據(jù)第2章的分析,公交車到站時間受多種因素的影響,其中包括了駕駛員的因素、車輛本身的因素、道路的因素、以及可能的突變因素的影響。在這些因素當中,其中很大一部分因素是可以量
45、化計算的,但是仍然有部分的因素是不能量化來計算的。本文的模型利用歷史的GPS數(shù)據(jù)為對當前車輛運行時間的影響因素,因為,前文歸納的人、車、路、不可控因素等的影響已經(jīng)在前續(xù)班次的到站時間中表現(xiàn)出來。在一定的時間段內,交通狀況具有一定的連續(xù)性,本文基于GPS的歷史數(shù)據(jù),運用回歸分析就是利用了這一點。本文以當前預測班次臨近的兩個班次的歷史數(shù)據(jù)作為當前班次到站時間的影響因素,建立起基于歷史到站數(shù)據(jù)的二元線性回歸模型。設當前某路段運行時間為Y、臨近的第一車次的該路段的歷史運行時間為X1、臨近的第一車次的該路段的歷史運行時間為X2,則有:y=a+b1x1+b2x2 (3.28)式中:y因變量X1、X2自變量
46、a、b1、b2待定回歸系數(shù)3.2.2 站點滯留時間預測在現(xiàn)有的GPS歷史數(shù)據(jù)當中,沒有直接的對公交車滯留時間的影響因素,故不能采用回歸分析法,但是存在著大量有規(guī)律的歷史數(shù)據(jù),故采用二次移動平均和二次指數(shù)平滑這兩種方法來綜合預測公交車滯留時間。(1)移動平均法設跨越期n=2個車次,令一次移動平均值Qt1;二次平均值為Qt2。at、bt為移動系數(shù);T由預測模型所處的時間周期至需要預測的時間之間的周期數(shù)。 則可建立二次移動平均法的預測模型:QT+t=at+btT (3.29)(2)指數(shù)平滑法一次平滑指數(shù)的計算公式為:Qt1=y1+1-Qt-11=k=0t-1(1-)kyt-k+(1-)tQ01 (3
47、.30)其中:Qt1t期的一次平滑值;Qt-11第t-1次的平滑值;平滑常數(shù),0 1;yt第t期的觀察值;Q01零期的指數(shù)平滑值;二次平滑的計算公式是建立在一次平滑之上的,為:Qt2= Qt1+(1-)tQt-12 (3.31)其中:Qt2第t期的二次指數(shù)平滑值;Qt1第t期的一次指數(shù)平滑值;Qt-12第t-1期的二次指數(shù)平滑值;3.3 綜合預測模型在公交車到站時間預測模型當中,站點的滯留時間采取了移動平均和指數(shù)平滑這兩種不同的預測方法。這兩種預測方法在使用時,分別考慮了不同的方面,預測的結果也有一定的差異。在這樣的情況下,并不能一味地否定或者肯定其中的某一種方法的預測結果,所以采取加權的方式
48、來綜合預測站點滯留時間,以便提高預測結果的準確程度。組合預測模型為:Y=WiYi (3.32)其中:Y綜合預測值,即組合模型的最終預測值;Wi第i種預測方法賦予的權重系數(shù),Wi=1;Yi第i種預測方法獲得的預測值;采用標準差法確定權重Wi:Wi=S-SiS1n-1 (3.33)式中:S=si,Si為第i種模型的標準差。3.4 公交車到站時間預測流程通過前面的分析過程,可以將本次建立的公交車輛預測模型的整個到站時間預測流程概括如圖3.1所示。圖3.1 到站時刻預測流程圖3.5 本章小結本章首先分析了到站時間預測模型的原始模型回歸模型和時間序列模型的原理及步驟,結合實際的公交車到站時間預測的問題,
49、本文建立起基于歷史數(shù)據(jù)的實時修正公交車到站時間預測模型,并對模型中涉及到的站點運行時間預測和站點滯留時間預測作了詳細的論述。并對整個公交到站時間的預測過程進行了流程分析。4 實例計算本文以重慶601路公交車在2013年12月24日6時40秒到8時50分23秒的25組歷史GPS數(shù)據(jù)作為預測到站時間的原始數(shù)據(jù)。通過車載GPS終端得到的GPS原始數(shù)據(jù),包括車牌、發(fā)車次數(shù)、發(fā)車時間、每隔十秒傳回的速度信息,以及站點之間的運行時間,站點的??繒r間等。通過以上的25組GPS數(shù)據(jù)來驗證公交車到站時間預測模型。4.1 數(shù)據(jù)的預處理4.1.1缺失數(shù)據(jù)的處理在獲取原始數(shù)據(jù)的過程中,由于城市高樓或者裝有GPS設備的
50、車輛臨時停車等原因導致GPS數(shù)據(jù)的丟失。數(shù)據(jù)的缺失是一種常見的誤差,尤其車輛在通過高樓林立的城市或者隧道時。所以有必要采取一定的措施對缺失的數(shù)據(jù)進行預處理。在本文的原始數(shù)據(jù)中,丟失的數(shù)據(jù)并不是大量,針對這樣少量丟失的數(shù)據(jù),根據(jù)情況的不同,采取不同的處理方法。第一種情況利用相鄰前一班次數(shù)據(jù)和后一班次求取均值的方法來求取缺失值:圖4.1 缺失數(shù)據(jù)示例圖1如圖4.1所示,車牌號為5702的7:24:23發(fā)車的車輛丟失了紅旗河溝東站、大廟站、小苑站這三個站的3組車輛運行時間,2組站點滯留時間數(shù)據(jù)。根據(jù)我們處理誤差的方法,則5702缺失的起點站嘉華世紀城到紅旗河溝東站的站點運行時間數(shù)據(jù)則為前一輛車牌為5
51、246的車輛經(jīng)過該路段的運行時間80秒和后一輛車牌號為10498經(jīng)過該路段的運行時間80秒的平均值,則缺失的數(shù)據(jù)為80秒。同理可以得到后面四個缺失的數(shù)據(jù),依次為:40秒,130秒,75秒,155秒。第二種情況利用眾數(shù)和時序均值的綜合方法來補齊缺失值:圖4.2 缺失數(shù)據(jù)示例圖2如圖4.2所示:由于本次收集到的GPS數(shù)據(jù)有限,只有25組,如果缺失的數(shù)據(jù)剛好是第25組,則沒有第26組的數(shù)據(jù)能參考,或者說連續(xù)缺失23、24、25這三組數(shù)據(jù),不但沒有第26組數(shù)據(jù)可以參考,而且也沒有在時序上連續(xù)的數(shù)據(jù)作為估值依據(jù),則第一種情形的誤差處理方法則顯得局限。根據(jù)情形二描述的缺失數(shù)據(jù)處理方法求取小苑站點的站點滯留
52、時間,由于缺失的是第25組數(shù)據(jù)的值,直接求取前面24組數(shù)據(jù)的眾數(shù)就可以了,其缺失的數(shù)據(jù)求得為10秒。又如華新街站點第24組數(shù)據(jù)和第25組數(shù)據(jù)的站點滯留時間缺失,則首先利用求取前面23組數(shù)據(jù)的眾數(shù)作為第25組數(shù)據(jù)的缺失值,再用第23組數(shù)據(jù)和第25組數(shù)據(jù)的均值作為第24組數(shù)據(jù)的缺失值。通過以上方法,可以將缺失的數(shù)據(jù)補全,但是,補上的數(shù)據(jù)并不一定完全準確,正是這個原因,為后期預測可能帶來的誤差埋下了隱患。4.1.2 錯誤數(shù)據(jù)的排查與更正本文通過折線圖的方式,排查出偏離的錯誤數(shù)據(jù),然后將將偏離的點舍去,該點的數(shù)據(jù)按照缺失數(shù)據(jù)的方式來處理。以上清寺站到兩路口站為例,首先統(tǒng)計出這25個車次的車輛分別需要的
53、時間由圖4.3所示,我們不難發(fā)現(xiàn),在6:00:40發(fā)車的班次從上清寺到兩路口的運行時間是900秒,而其余班次基本在100秒左右波動,這說明900秒這個數(shù)據(jù)存在著明顯的錯誤,應該給予修正。圖4.3 錯誤數(shù)據(jù)折線圖首先應該將900這個值舍去,現(xiàn)在變?yōu)槿笔У臄?shù)據(jù)的處理了。則該位置的值選取眾數(shù)為110秒,錯誤值處理后的圖4.4所示。圖4.4 錯誤數(shù)據(jù)更正折線圖其余各組數(shù)據(jù)均可按照此方法對存在的錯誤數(shù)據(jù)進行排查和更正。4.2 數(shù)據(jù)的粗分析對GPS數(shù)據(jù)分析的目的主要是想通過運用統(tǒng)計的方法,能發(fā)現(xiàn)現(xiàn)有的GPS數(shù)據(jù)在時間和空間分布上的規(guī)律,為公交車到站時間預測模型的建立提供必要的數(shù)據(jù)依據(jù)。由于收集到的GPS所表達的數(shù)據(jù)量很龐大,本小節(jié)的主要任務就是將信息歸類,便于直觀地觀察其分布規(guī)律,如表4.1所示的是各個班次到達各個站點的總運行時間。表4.1 各個班次車輛到達各個站點的總時間
- 溫馨提示:
1: 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
2: 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
3.本站RAR壓縮包中若帶圖紙,網(wǎng)頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
4. 未經(jīng)權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
5. 裝配圖網(wǎng)僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 6.煤礦安全生產(chǎn)科普知識競賽題含答案
- 2.煤礦爆破工技能鑒定試題含答案
- 3.爆破工培訓考試試題含答案
- 2.煤礦安全監(jiān)察人員模擬考試題庫試卷含答案
- 3.金屬非金屬礦山安全管理人員(地下礦山)安全生產(chǎn)模擬考試題庫試卷含答案
- 4.煤礦特種作業(yè)人員井下電鉗工模擬考試題庫試卷含答案
- 1 煤礦安全生產(chǎn)及管理知識測試題庫及答案
- 2 各種煤礦安全考試試題含答案
- 1 煤礦安全檢查考試題
- 1 井下放炮員練習題含答案
- 2煤礦安全監(jiān)測工種技術比武題庫含解析
- 1 礦山應急救援安全知識競賽試題
- 1 礦井泵工考試練習題含答案
- 2煤礦爆破工考試復習題含答案
- 1 各種煤礦安全考試試題含答案