本文是一篇物流論文,本文分析司機找貨路線的時序變化發現,司機找貨行為具有明顯的時刻特征,一天內的不同時段對司機的路線選擇具有顯著影響,用戶在不同時段上存在不同的偏好,司機在上午的找貨路線更多更復雜,下午次之,夜間的復雜度最低。而在一周內的每一天基本是穩定的。
第1章 緒論
1.1 研究背景及意義
1.1.1 司機尋貨推薦的背景和意義
隨著我國經濟的不斷發展,貿易量逐年上升,物流運輸的重要性愈加突出。其中,公路運輸是我國貨運的主要運輸方式,根據國家統計局數據顯示,2020年我國貨運總量為463.47億噸,其中,公路貨運量為342.6億噸,占比約為74%。根據有關數據顯示,我國約有3000多萬名貨車司機從事公路運輸行業,近年來,他們承運了全國70%以上的貨物,是我國物流運輸行業的主力軍。相較于其他發達國家而言,我國的公路貨運運力結構比較特殊,個體散戶司機比率超90%,區域運力分散化,碎片化程度極高。
隨著移動互聯網和人工智能技術的應用,公路貨運平臺應運而生。現我國76.5%的司機都已入駐以滿幫、云鳥配送、貨拉拉等為代表的在線貨運交易平臺。盡管公路貨運交易平臺集合了數百萬的貨車用戶,但仍舊是獨立的個體司機,平臺尚不具備全面實施車貨匹配的調度能力。司機尋找貨源的方式仍然是以搜索為主,以國內知名車貨匹配平臺“運滿滿”app為例,活躍用戶中100%的司機會使用“搜索”,截取運滿滿司機端app的主頁如圖1-1所示,主要業務在“配貨大廳”和“當天貨源”中,“配貨大廳”記錄的是司機自己訂閱的路線,而“當天貨源”為搜索篩選界面。
由于司機運輸不受平臺管轄,因此平臺業務中更多的還是由貨車司機和貨主分別提供運力信息和貨單信息在線自由交易。平臺的主要業務或者是由司機自發檢索合適的貨物或者是將一些新發貨源通過橫幅、播報的方式通知司機。從圖1-1可以看出現行的車貨匹配平臺的業務主要還是以司機自行檢索,即車找貨為主,盡管國內車貨匹配做了比較豐富的研究,但實際匹配效率并不高,僅使用實際運單數據難以觀察到司機的偏好變化過程。司機自發檢索存在效率低下的問題,平臺為司機提供了越來越多的貨物信息選擇,反而較低了對這些海量信息的利用率,貨物信息過載現象越來越嚴峻,司機在平臺搜貨的過程中消耗的時間成本成倍增加;平臺推送存在策略精準問題,現有的推薦算法效益并不高,如果推送貨源不符合司機需求,不僅容易導致用戶投訴,同時可能丟失一些忠實用戶。
1.2 國內外研究現狀
為了實現基于在線交易平臺的司機尋貨路線推薦,挖掘司機個體出行特征、了解線上交易推薦模式和推薦模型以及明確該問題的研究現狀是其中的關鍵內容。
1.2.1 出行特征挖掘
目前,研究學者們已經利用移動軌跡數據、智能公交數據等對人類個體、普通車輛等進行了豐富的移動特征的探索。
利用移動軌跡數據分析乘客的出行特征在各領域都得到了廣泛關注[7-11]。傳統居民出行特征的出行需求收益調查,通常以日間乘客的交通調查為基礎,挖掘“靜態”居民出行需求特征。Wen Li等人(2020)分析了居民出行特征和偏好,探討了社會經濟屬性、出行特征、偏好的主要影響因素[12]。Cai Xiaoyu等人(2021)基于歷史RFID軌跡數據,對私家車和出租車的軌跡數據進行挖掘,從出行頻率、上線時間、軌跡重復率、出行周期、活動偏好區域和主線影響區域偏好對私家車和出租車中存在的特征群體進行識別和分類[13]。與此同時,研究發現無論在時間上還是在空間上,城市出行行為都在發生變化[14-16]。因此,識別城市出行行為至關重要,尤其是描述這種動態行為[17]。Xu H J等人(2019)融合了城市居民出行方式和居民出行選擇行為動態預測居民的出行需求[18]。Xia D等人(2021)利用出租車軌跡數據分析乘客的出行時長和出行距離,提出了一種并行聚類方法挖掘乘客出行的時空特征,從而獲得居民出行在一天中不同時段的特征變化[19]。
第2章 數據處理與基本分析
2.1 數據介紹與預處理
2.1.1 數據介紹
本文使用的數據源是司機在線上貨運交易平臺的搜索、點擊、成交數據,搜索和點擊被看作是司機成交前的準備,而成交則是司機實際的交易數據。為保證平臺信息不輕易泄露,文中將對司機ID等信息進行隱藏。選取了2021年4月26日-2021年5月16日在平臺產生了交易訂單的部分司機的行為數據,其中,這部分司機在5月21日-5月26日均有線上行為,總共選取了812名司機。
樣本數據記錄了司機在平臺上產生的行為,搜索、點擊和成交都是由司機自發產生,因此各個司機的數據條數不一。數據字段和示例如表2-1、表2-2、表2-3所示,數據字段包括:user_id, create_time, action, start_city_name, end_city_name, loc_city。
2.2司機線上行為分布特征
司機線上行為數據包括搜索、點擊和成交,其中,路線成交數據是司機實際交易的行為,稱為交易數據;路線搜索和點擊數據屬于司機找貨的過程,稱為找貨數據。本研究中將使用大量的司機找貨數據預測司機可能成交的路線,因此首先需要論證司機的找貨數據是否足以分析司機的交易概率。所以,本節將對比司機交易數據和找貨數據的時空分布情況,觀察找貨數據的有效性。
2.2.1 司機線上尋貨時間分布特征
根據成交單數分析司機的交易時間分布,確定交易密集時間;根據找貨頻次分析司機的找貨時間分布,確定找貨密集時間;并觀察司機尋貨路線的時間分布形態。如圖2-3所示,藍色表示司機每小時的成交單數分布,橙色表示司機每小時的找貨記錄分布,明顯看出,司機的交易時間分布和找貨時間分布基本統一,司機的找貨特征反映了接單特征。
從成交單數的角度分析,司機的成交密集時間主要分布在上午8-11時,其中,8時和9時的成交單最多,第二個波峰值出現在下午2時。從找貨頻次的角度分析,司機的密集找貨時間同樣在上午8-11時,8時和9時出現第一個波峰,第二個波峰出現在下午3時出現。夜間的成交量和搜貨量都非常低,大約是22時至第二日5時內,司機的線上行為較少。總體來看,上午7-9時司機的線上行為急劇增多,與此同時,10-13時又有急劇減少的表現,14-17時是下午時段的活躍高峰,推測上午7-9時和下午14-17時是貨物裝卸的高峰時期。從時間分布形態來看,司機的找貨密集時刻也正是成交密集時刻,找貨分布趨勢變化與成交分布趨勢變化基本一致,說明司機線上找貨效果好,時間具備同步性。
第3章 司機尋貨路線特征挖掘 ........................... 24
3.1 線上尋貨路線的時間分布特征 ............................. 24
3.2 線上尋貨路線的地理分布特征 .................................... 26
第4章 基于區域潛在路線挖掘的推薦算法 ............................. 38
4.1 區域潛在路線挖掘 .................................. 38
4.2 有效性分析 ...................................... 41
第5章 基于在線貨運平臺的推薦模型及實證分析 ............................ 47
5.1 問題定義 ........................................ 47
5.2 模型描述 ..................................... 48
第5章 基于在線貨運平臺的推薦模型及實證分析
5.1 問題定義
本章將解決的問題是:利用司機既有行為中的路線偏好,根據司機青睞路線發生變化的條件,挖掘不同場景下的司機青睞路線特征,離線推薦司機青睞路線集合并按照可能成交概率降序排序。因此,本章構建的模型架構如圖5-1所示,分為三個模塊,分別是輸入層、推薦層和輸出部分。其中,輸入層除了已有的6個字段以及還包括出發地和目的地的地理標簽,判斷是否為司機路線搜索中的熱點區域等。推薦層邏輯是:將輸入的數據從時間變化和位置變化切分轉化形成新的可用于模型訓練的數據及特征,優化評分矩陣內容。而后從全部可能的路線中確定對于目標司機而言可能推薦的全部路線即為全部召回,再根據相似用戶和目標用戶對每條路線的交互權重設計生成推薦概率,取其中可能成交率大于30%的路線降序排序,得到TOP-N條路線生成推薦結果。而這個推薦結果一般是以列表的形式呈現。
總結與展望
(一)結論
本文基于司機在線貨運交易數據,包括找貨行為數據和交易數據,首先對其進行一定的處理,然后對比分析了司機的找貨行為與交易行為,挖掘了司機的找貨時間特征、地理特征和定位地特征并對司機的行為模式進行了區分,在此基礎上基于Voronoi算法挖掘了司機可能選擇的潛在路線并分析了其算法有效性,最后從時空策略方面構建了司機找貨路線推薦模型,取得了穩定的效果,為實現高效的車貨匹配奠定了基礎。主要獲得的結論有如下幾點:
(1)貨車司機選擇路線的找貨行為特征與交易行為特征一致,從時間分布形態來看,司機的找貨密集時刻也正是成交密集時刻,找貨分布趨勢變化與成交分布趨勢變化基本一致,時間具備同步性。并且發現司機要想成交一單,需要自主搜索約667單在線貨源,大約需要兩天時間。從空間分布來看,司機的找貨距離特征基本反應了司機的實際接貨距離特征,與交易特征存在一致性。分析發現司機的尋貨半徑大概在400km以內,且更偏向于中短途運輸。主動搜索與實際承運之間的容忍在50km-60km,司機實際承運時會更加放寬訂單選擇條件。充分證明研究司機線上尋貨路線的偏好,并實現司機青睞路線的預測和推薦是合理且有意義的。
(2)分析司機找貨路線的時序變化發現,司機找貨行為具有明顯的時刻特征,一天內的不同時段對司機的路線選擇具有顯著影響,用戶在不同時段上存在不同的偏好,司機在上午的找貨路線更多更復雜,下午次之,夜間的復雜度最低。而在一周內的每一天基本是穩定的。
(3)分析司機找貨路線的地理分布發現,司機找貨行為具有明顯的地理特征,地理因素對司機的路線選擇具有顯著影響。通過對城市進行地理位置劃分可將司機的找貨路線行為歸納為三類,分別是“干線型”模式、“軸輻式”模式和“環型”模式,其中,“干線型”模式占比最高。融合地理區域的近鄰性有助于挖掘司機潛在偏好路線,提高路線推薦的精度。
參考文獻(略)
相關文章
UKthesis provides an online writing service for all types of academic writing. Check out some of them and don't hesitate to place your order.