基于LSTM神經(jīng)網(wǎng)絡的公交行程時間預測案例

徐丸絮，沈吟東

（華中科技大學人工智能與自動化學院，湖北武漢 430074）

摘??要：傳統(tǒng)的公交行程時間預測模型由于忽略了歷史時刻中的信息，導致預測精度不理想。針對公交行程時間的時序性，提出一種基于 LSTM 神經(jīng)網(wǎng)絡的預測模型，并引入注意力（Attention）機制對其進行優(yōu)化。首先，綜合考慮多種影響因素，設計了多變量 LSTM 模塊，將當前時刻的行程時間與歷史時刻數(shù)據(jù)相關(guān)聯(lián)，對其中的多維度特征進行信息提取；隨后針對單一 LSTM 網(wǎng)絡無法自動識別不同信息重要性的局限性，引入 Attention 機制，使模型聚焦重點信息、忽略冗雜信息；最后，采用實際公交 GPS數(shù)據(jù)驗證了該方法的有效性。實驗結(jié)果表明，與五種常見方法相比，該模型具有更高的精度。

中圖分類號：TN99?34??文獻標識碼：A

文章編號：1004?373X（2022）03?0083?05

0 引言

公交行程時間是智能交通系統(tǒng)的重要組成部分，準確的行程時間信息為公交智能優(yōu)化排班、實時調(diào)度、公交交叉口優(yōu)先控制等提供重要依據(jù)，對公交資源動態(tài)配置、城市交通結(jié)構(gòu)規(guī)劃等有深遠意義。

近年來，國內(nèi)外學者對這一問題展開了廣泛研究，提出的預測模型主要包括4類：

1）卡爾曼濾波器模型[1?2]。如文獻[1]分析了異構(gòu)交通條件下時間的離散化模式，以此構(gòu)建了基于卡爾曼濾波器的預測模型。但是該模型考慮因素較單一，且適用于線性系統(tǒng)，對于高度非線性的公交行程時間預測問題并不是很合適。

2）支持向量機（SVM）模型[3?4]。如文獻[3]選取時段、天氣等7維特性構(gòu)建了改進的 SVM 預測模型，并在廈門BRT?1路的數(shù)據(jù)上驗證了模型精度。但該類模型計算復雜度高，不能很好地處理大規(guī)模數(shù)據(jù)。

3）決策樹模型。如文獻[5]構(gòu)建了一種基于梯度提升回歸樹（GBRT）的預測模型，測試結(jié)果比SVM和自回歸平均法的預測精度有所提高。該模型可解釋性強，但是存在模型速率低、易過擬合等問題。

4）神經(jīng)網(wǎng)絡模型。該模型在行程時間預測問題中使用最為廣泛，如文獻[6]將螢火蟲算法與BP神經(jīng)網(wǎng)絡結(jié)合，構(gòu)建了預測模型；文獻[7]構(gòu)建了面向動態(tài)站點的BP 神經(jīng)網(wǎng)絡預測模型，實現(xiàn)了跨越多個站點的預測；文獻[8]通過采集到的歷史和實時數(shù)據(jù)構(gòu)建了神經(jīng)網(wǎng)絡。神經(jīng)網(wǎng)絡能夠較好地擬合非線性問題，在行程時間預測問題上很有意義，然而公交行程時間具有時序性，即當前時刻行程時間與歷史時刻密切相關(guān)，上述模型的不足之處在于僅考慮了當前時刻的信息，沒有充分利用歷史時刻的數(shù)據(jù)，導致模型精度受限。

深度學習與傳統(tǒng)的學習方法相比，它具備更強大的數(shù)據(jù)學習和抽象能力。LSTM（Long Short?Term Memory）作為目前最熱門的深度學習技術(shù)之一，能夠保存歷史信息，既繼承了傳統(tǒng)神經(jīng)網(wǎng)絡的優(yōu)勢，又能挖掘歷史時刻數(shù)據(jù)，在處理時序問題上很有優(yōu)勢[9]，近幾年得到了廣泛應用。文獻[10]使用英國66個路段的數(shù)據(jù)構(gòu)建了改進的LSTM模型；文獻[11]采用LSTM網(wǎng)絡進行預測，并與BP神經(jīng)網(wǎng)絡進行了對比，結(jié)果證明LSTM精度更優(yōu)。然而傳統(tǒng)的LSTM將輸入序列轉(zhuǎn)換為定長向量而保存所有的信息，使得模型記憶受限，在處理長序列問題時易丟失信息。

Attention機制的提出可以彌補這一缺陷，它能為不同信息賦予權(quán)重，加強對重要信息的記憶，忽略無關(guān)信息。近年來，結(jié)合注意力機制的神經(jīng)網(wǎng)絡成為研究的熱點，被廣泛應用于機器翻譯、圖像分類等領域，在公交行程時間預測問題上的研究相對較少。因此，本文提出一種基于Attention機制的LSTM預測模型，利用LSTM模塊，對歷史數(shù)據(jù)中多種因素同步分析，針對LSTM的局限性，融入Attention機制，自動抽取關(guān)鍵信息，優(yōu)化模型。最后與五種常見方法進行對比發(fā)現(xiàn)，該模型有更高的預測精度。

1 問題定義

本文旨在基于公交企業(yè)積累的大量行程時間樣本，設計一個行程時間預測方法。公交行程時間在不同日期、時段是隨機變化的，與路況、事故等動態(tài)因素密切相關(guān)[12]。由于班次之間時間間隔較短，相鄰班次之間的路段狀況具有相似性，因此歷史時刻的數(shù)據(jù)中蘊含著影響未來的信息，即當前時刻的行程時間與歷史時刻有關(guān)，由此可見，公交行程時間具有時序性，是一個前后關(guān)聯(lián)的時間序列。

根據(jù)行程時間的時序性，該問題可描述如下，由前s 個時刻的歷史行程時間序列 [yt-s,?, yt-2 , yt-1]（s代表時間步長度，即歷史時刻個數(shù)）和歷史特征[xt-s,?,xt-2, xt-1]預測t時刻的公交行程時間yt，即：

式中：xi=(xi,1,xi,2,?,xi,n)T代表第i時刻影響行程時間的多種因素的取值向量，n代表影響因素的個數(shù)；F為函數(shù)，代表預測值與輸入值之間的某種映射關(guān)系。本文的目的就是找到合適的模型用于擬合這種復雜的非線性映射。

2 公交行程時間影響因素分析

常見的LSTM模型僅考慮“歷史行程時間”這一種歷史數(shù)據(jù)[10?11]，然而行程時間受多種因素影響，如果模型僅對單變量進行處理，并不能充分考慮多種影響因素的變化。因此本節(jié)對行程時間影響因素進行分析，以期得到更全面的輸入特征。

影響公交行程時間的不確定因素主要包括道路因素、交通因素、天氣情況等[13]。道路和交通因素如路段狀況、行人數(shù)量、乘客數(shù)量等信息，動態(tài)影響著行程時間；天氣情況如降雨、降雪、大霧等會影響公交速度和司機反應時間，從而影響行程時間。

根據(jù)上述行程時間影響因素分析，本文選取了行駛特征集以描述道路和交通因素，選取了天氣特征集以描述天氣因素，以此作為模型輸入。具體獲取和處理如下：

1）行駛特征集

由于路況、人流等實時信息無法直接獲取，為反映車輛行駛路段狀況、人流量等信息，選取當天是否是周末、是否是高峰期等靜態(tài)特征，同時提取車輛平均速度、車輛行駛方向等作為動態(tài)特征，用以反映實時交通狀況。

2）天氣特征集

采用網(wǎng)絡爬蟲獲取結(jié)構(gòu)化的天氣數(shù)據(jù)，主要包含如下屬性：時間、溫度、氣壓、天氣狀況等。選取其中與行程時間密切相關(guān)的溫度和天氣狀況作為天氣特征集。

綜上所述，選取的輸入特征一共有6個，分別為當天是否是周末、是否是高峰期、車輛平均速度、車輛行駛方向、溫度、天氣狀況，即影響因素的個數(shù)n=6。

3 基于 Attention?LSTM 的公交行程時間預測模型

公交行程時間是一個典型的時間序列，LSTM網(wǎng)絡能自動保存歷史序列信息，更好地利用其時序性。然而不同信息對于預測時刻的影響程度是隨時間動態(tài)變化的，例如，對早晚高峰期來說，人流量對行程時間的影響要大于對平峰期的影響；單一的LSTM模型將輸入序列轉(zhuǎn)換為定長向量而保存所有的信息，并不能檢測哪些是影響當前行程時間的重要部分，降低了信息的利用率；Attention機制的加入能解決這一問題，它為模型分配不同的注意力，使模型能自動處理不同信息的重要程度。本文嘗試將LSTM與Attention機制結(jié)合，用于公交行程時間預測，本文提出的Attention?LSTM預測模型整體結(jié)構(gòu)如圖1所示。

由圖1可見，該模型由4個部分組成：輸入層負責將預處理后的數(shù)據(jù)轉(zhuǎn)換成模型可讀的形式；多變量LSTM模塊負責對包含多種影響因素的輸入數(shù)據(jù)進行處理，獲取特征信息；Attention 機制負責學習一組注意力系數(shù)，對特征信息進行篩選；全連接層接收篩選后的特征信息，處理得到最終的行程時間預測結(jié)果。輸入層和全連接層是模型完成預測任務必需的組件，其結(jié)構(gòu)由數(shù)據(jù)本身的維度決定，整個模型的重點部分在于多變量 LSTM模塊與Attention機制。

3.1 多變量 LSTM 模塊

基本的LSTM網(wǎng)絡是由多個記憶神經(jīng)元按時間次序連接而成的[14]。經(jīng)典的記憶神經(jīng)元內(nèi)部結(jié)構(gòu)如圖2所示。

由圖2可見，記憶神經(jīng)元內(nèi)部由輸入門it、遺忘門ft、輸出門ot三種門結(jié)構(gòu)組成，它們共同控制著信息的更新與遺忘，計算公式見式（2）~式（7）：????

式中：σ代表sigmoid函數(shù)；Ct和Ct-1分別代表LSTM單元在t 時刻和t-1時刻的狀態(tài)；Ct 代表當前單元狀態(tài)更新值；ht和ht-1分別為當前單元和上一單元的中間狀態(tài)；wf，wi，wo，bf，bi和bo為模型訓練得到的權(quán)重矩陣和偏移量。

由此可見，LSTM網(wǎng)絡通過門結(jié)構(gòu)對信息進行繼承，能夠?qū)崿F(xiàn)更長期的記憶。本文利用這一特性，在基本LSTM的基礎上設計了多變量LSTM模塊，該模塊由兩層LSTM網(wǎng)絡堆疊而成，在t時刻的輸入為Ft=[yt-1, xt-1,1,xt-1,2,?,xt-1,n ]T，其不僅接收上一時刻的歷史行程時間真實值yt-1，且對代表多種影響因素的序列[xt-1,1,xt-1,2,?,xt-1,n ]T進行處理，多變量的引入使模型從更多方面接收反映行程時間的信息，可以更充分地挖掘歷史數(shù)據(jù);最終獲得整個模塊在t時刻的輸出向量[ht-s+1,?,ht-1,ht]，其中蘊含著用于行程時間預測的多維度信息。

3.2?結(jié)合 LSTM 的Attention機制

本文引入的Attention機制結(jié)構(gòu)如圖3所示，其對LSTM模塊的輸出向量[ht-s+1 ,?,ht-1 ,ht]進行學習，得到一系列注意力系數(shù)[αt-s+1,?,αt-1,αt]，用以表示每一中間狀態(tài)的重要程度。最后對各中間狀態(tài)加權(quán)求和得到輸出序列H，計算公式見式（8）~式（10）

式中：V，W代表權(quán)重矩陣；b為相應的偏置值；et為計算t時刻注意力系數(shù) αt的中間值。

由此可見，融合Attention機制后，模型可以自主學習各狀態(tài)的重要程度，從復雜的數(shù)據(jù)中提取出重要的部分。

4 實驗與分析

為了測試所提出模型的性能，基于真實數(shù)據(jù)進行實驗，并與多種常見預測模型進行對比，以驗證該模型的有效性。

4.1 數(shù)據(jù)預處理

本文采用某市290路公交車2017年1月1日—2月28日不同班次產(chǎn)生的GPS數(shù)據(jù)作為研究對象，該數(shù)據(jù)的每一行代表一條公交行程記錄，每一列代表不同的屬性；為了避免數(shù)據(jù)缺失對模型預測造成影響，采用缺失值的前 1天以及后 1天相同時刻的數(shù)據(jù)均值補全缺失數(shù)據(jù)。另外，為了使輸入數(shù)據(jù)數(shù)量級保持一致，采用最大最小值歸一化法，使數(shù)據(jù)都被限定在[0，1]范圍內(nèi)。

4.2 模型參數(shù)設置及評價

通過多次實驗發(fā)現(xiàn)，當時間步長s為 9、LSTM隱含層節(jié)點數(shù)為8時模型表現(xiàn)最好。為了提高訓練速率，采用批量訓練的方式，每批含72組樣本數(shù)據(jù)，為了避免過擬合，在每層 LSTM 網(wǎng)絡后增加隨機失活（dropout）層，參數(shù)設置為0.2，選擇平均絕對誤差（MAE）作為訓練的損失函數(shù)，采用 Adam 算法對網(wǎng)絡進行訓練，迭代次數(shù)設置為 100次。

為評估模型的可靠性，本文同時采用平均絕對誤差（MAE）與平均絕對相對誤差（MAPE）評估模型的預測能力。具體見式（11）和式（12），其中yi表示預測值，yi表示真實值，m表示實驗所用數(shù)據(jù)總量。

當MAE越小時，表示誤差越??；當MAPE越小時，表示預測精確度越高。

4.3 結(jié)果分析

本文采用的數(shù)據(jù)集一共12157條，選擇前9000條數(shù)據(jù)作為訓練集，后3157條數(shù)據(jù)作為測試集，模型訓練過程中誤差變化趨勢如圖4所示。由圖4可知，Attention?LSTM模型誤差不斷下降，較快達到收斂，最終誤差降為0.544，說明訓練結(jié)果良好。

為了以更直觀的方式驗證模型預測效果，利用該模型對測試集中隨機選取的1000個樣本進行預測，結(jié)果如圖5所示。由圖5可見，所提出的模型能夠較好地擬合行程時間的劇烈變化。

為分析Attention機制的加入對模型的影響及有效性，對模型預測過程中不同時間步的注意力系數(shù)結(jié)果進行展示，如圖6所示。

由圖6可以看出：不同時間步對行程時間的影響程度不同，注意力系數(shù)使得模型重點關(guān)注第2，3，9個時間步，而對第5，6個時間步的關(guān)注較低，由此可見，Attention機制可以使模型自動關(guān)注重要的歷史時刻，從而提高了模型對關(guān)鍵信息的篩選與利用。同時也說明，公交行程時間是一個明顯的時序性數(shù)據(jù)，模型的注意力并非集中在距離預測點較近的時間步上，而是對長時間步中的信息都有關(guān)注。

為了進一步比較提出的Attention ?LSTM模型和其他模型的預測性能，本文構(gòu)造了 BPNN、RNN、LSTM、GBRT、XGBoost等五種常見預測方法，在相同的測試集上進行預測，得到的預測結(jié)果如表 1所示。

根據(jù)表1可以得到如下結(jié)論：

1）與其他幾種常見的預測模型相比，本文構(gòu)建的Attention?LSTM 模型在各項指標中均為最優(yōu)，在測試集中MAE=137.729，MAPE=4.952%。另外，與RNN 相比，預測精度提高了21.9s左右，精度提高了1.8%左右，證明了LSTM在處理公交行程時間這類長序列問題上的優(yōu)勢；與未融入Attention機制的LSTM 模型相比，預測結(jié)果提高了8.7s左右，精度提高了0.4% 左右，再次證明了Attention機制加入的有效性。

2）基于深度循環(huán)神經(jīng)網(wǎng)絡的這類模型（Attention?LSTM、LSTM 和 RNN）的預測性能明顯優(yōu)于傳統(tǒng)的淺層學習方法（BPNN）和決策樹類方法（GBRT、XGBoost），其原因在于模型深度和結(jié)構(gòu)的提升能夠更全面地捕捉數(shù)據(jù)中的信息，而循環(huán)神經(jīng)網(wǎng)絡類的模型能夠很好地利用行程時間的時序性，充分利用歷史數(shù)據(jù)，使得預測精度提高，說明了深度學習在預測問題上的有效性。

5 結(jié) 語

本文針對公交行程時間的時序性，提出了融入Attention機制的LSTM預測模型。該模型利用LSTM模塊對多維度特征進行捕捉，并通過Attention機制克服了LSTM的局限性，利用模型對復雜信息進行篩選。實驗結(jié)果表明，LSTM在行程時間預測問題上很有優(yōu)勢，Attention機制的引入，使模型能夠自動關(guān)注重要的歷史時刻，提高了模型的預測精度。同時，與五種常見預測方法相比，證明了該模型具有更高的預測可靠度，說明此方法具有較高的實用價值。

注：本文通訊作者為沈吟東。

參考文獻

[1] KUMAR B A，VANAJAKSHI L，SUB RAMANIAN S C. Pattern?based time ? discretized method for bus travel time prediction[J]. Journal of transportation engineering， part A：systems，2017，143（6）：04017012.

[2] DEESHMA M，VERMA A. Travel time modeling for bus trans?port system in Bangalore city [J]. Transportation research，2015，7（1）：47?56.[3] 張洋，程恩 .基于 ε?支持向量機回歸的快速公交到站時間預測[J].廈門大學學報（自然科學版），2017，56（3）：442?448.

[4] BAI C，PENG Z R，LU Q C，et al. Dynamic bus travel timeprediction models on road with multiple bus routes [J]. Compu?tational intelligence and neuroscience，2015（3）：432389.

[5] 龔越，羅小芹，王殿海，等 .基于梯度提升回歸樹的城市道路行程時間預測[J].浙江大學學報（工學版），2018，52（3）：453?460.

[6] 彭新建，翁小雄. 基于螢火蟲算法優(yōu)化BP神經(jīng)網(wǎng)絡的公交行程時間預測[J]. 廣西師范大學學報（自然科學版），2017，35（1）：28?36.

[7] 韓勇，周林，高鵬，等 . 基于 BP 神經(jīng)網(wǎng)絡的公交動態(tài)行程時間預測方法研究[J].中國海洋大學學報（自然科學版），2020，50（2）：142?154.

[8] XIE J M，CHOI Y K. Hybrid traffic prediction scheme for intel?ligent transportation systems based on historical and real ? timedata [J]. International journal of distributed sensor networks，2017，13（11）：74500.

[9] AGAFONOV A A，YUMAGANOV A S. Bus arrival time pre?diction using recurrent neural network with LSTM architecture[J]. Optical memory and neural networks，2019，28（3）：222?230.

[10] DUAN Y J，YISHENG L V，WANG F Y. Travel time predic?tion with LSTM neural network [C]// 2016 IEEE 19th Interna?tional Conference on Intelligent Transportation Systems（ITSC）. Rio de Janeiro，Brazil：IEEE，2016：1053?1058.

[11] 張威威，李瑞敏，謝中教 .基于深度學習的城市道路旅行時間預測[J].系統(tǒng)仿真學報，2017，29（10）：2309?2315.

[12] 王殿海，湯月華，陳茜，等 . 基于 GPS 數(shù)據(jù)的公交站點區(qū)間行程時間可靠性影響因素[J]. 東南大學學報（自然科學版），2015，45（2）：404?412.

[13] 王芳杰，王福建，王雨晨，等 .基于 LightGBM 算法的公交行程時間預測[J]. 交通運輸系統(tǒng)工程與信息，2018，19（2）：116?121.

[14] 王志建，李達標，崔夏 .基于 LSTM 神經(jīng)網(wǎng)絡的降雨天旅行時間預測研究[J].交通運輸系統(tǒng)工程與信息，2020，20（1）：137?144.

作者簡介：

徐丸絮（1997—），女，江西鷹潭人，碩士研究生，研究方向為深度學習、公交行程時間預測。

沈吟東（1965—），女，安徽合肥人，博士，教授，博士生導師，研究方向為運籌與優(yōu)化、公共交通規(guī)劃與調(diào)度、智能公交系統(tǒng)。

編輯：黃飛

閱讀全文

神經(jīng)網(wǎng)絡(107115) 神經(jīng)網(wǎng)絡(107115)
智能交通(44997) 智能交通(44997)
深度學習(124080) 深度學習(124080)

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

基于LSTM神經(jīng)網(wǎng)絡的公交行程時間預測案例

評論