“一騎紅塵妃子笑,無人知是荔枝來。”這是中國古代對“快遞”最廣為人知的描述。時至今日,品嘗一顆鮮美的荔枝已不再困難,物流服務也不再只是簡單地將東西送達。如何讓快遞的每個環節效率最大化,找到運送貨物的最優路徑,減少理賠,成為快遞企業需要解決的問題。
近日,在北京舉辦的“微軟亞洲研究院創新論壇2019”上,微軟亞洲研究院分享了利用人工智能(AI)技術推動快遞業務高效運轉的兩個案例。在人工智能技術幫助下,針對個人用戶快遞業務,順豐公司已做到了智能理賠預警,將準確率提升了60%。海上航運方面,東方海外航運在AI的幫助下,可在毫秒內完成實時路徑優化,大大提高了航運效率。
智能理賠預警,準確率提升60%
對順豐來說,每天需面對大量的個人用戶快遞業務,會出現一定幾率的需求風險,如惡意騙賠等。微軟亞洲研究院與順豐的合作就從這一業務場景切入。
微軟亞洲研究院副院長劉鐵巖在接受媒體采訪時稱:“微軟亞洲研究院與順豐合作的具體任務是做理賠預警。合作過程中,我們發現如果現實中做簡單的分類任務,比如做基礎研究,數據都是非常規整的,有標準的數據集。可是到了實際業務中,絕大部分的訂單是正常的,只有萬分之幾甚至是十萬分之幾的訂單是有問題的,所以拿到的數據會是一個嚴重不平衡的數據,大量的樣本針對這一問題其實都沒有價值,只有少量的樣本有價值,是非常不平衡的,這是在合作中很明顯的一個鴻溝和挑戰。”
什么樣的快遞訂單有風險?該如何去判斷?傳統做法是從訂單信息中提取人工特征,利用梯度提升樹方法學習理賠預警模型。然而,當模型達到一定準確率后,繼續提升模型性能會付出極大的人工代價。另外,當線上數據分布發生變化時,原來的人工特征也容易在新的場景下失效,造成線上模型性能的下降。
為了構建合適的優化方案,微軟亞洲研究院的研究員對數據進行了深入分析,發現方案構建的核心難點在于,歷史數據中理賠訂單僅占全部訂單的萬分之幾,極度不平衡的樣本比例使得傳統機器學習方法無法達到理想效果。目前已知的處理不均衡數據的解決方案,無論在學術界還是工業界,均達不到智能理賠預測問題的要求。
為了解決這個難題,微軟亞洲研究院采用了“深度因子分解+基于精度的級聯”方案,利用多次選擇交叉驗證集減少由于分布變化造成的影響。通過對歷史數據的測試,目前該模型在固定召回率的前提下,準確度已經比原始方法提升了約60%。
智能航運:實現毫秒內完成實時路徑優化
在微軟亞洲研究院與東方海外航運的合作中,則覆蓋了供需預測和路徑優化這兩個物流行業的主要業務場景,通過運用深度學習和強化學習等最新的人工智能技術,來優化現有的航運網絡運營。
在過去的幾十年里,航運企業通常采用基于運籌學的組合優化方法來實現路徑規劃。這種方法一般需要首先對供需進行預測,然后基于預測結果,將有關客戶、港口、航線、區域的限制信息人為設置成現有商業軟件的約束條件,并用其進行求解。
但對于東方海外航運來說,其全球港口數量眾多、船只數目也很大,采用這種方法會讓商業軟件不堪重負。作為一種折中,人們通常需要將幾個港口劃成一個片區進行處理,而即便如此,實現一次優化仍然費時費力,每天可能需要花費數個小時來計算路徑優化的方案。而一旦外部條件發生變動,就不得不重新執行如此費時費力的優化過程,才能做出合理的應激反應,這種延時對于航運公司會造成不小的損失。此外,對貨品和空箱的供需預測,很難做到非常高的精準度。這種情況下,先預測再優化的方式或造成誤差傳導,導致整個優化過程的效果受損。
為了突破方法的局限性,微軟亞洲研究院在與東方海外航運的合作中探索出了一套全新的解決方法——競合多智能體強化學習技術(Coopetitive Multi-Agent Reinforcement Learning)。它把每一個港口和船只建模成智能體,對原來的復雜問題分而治之,以去中心化的方式進行求解。
微軟亞洲研究院的研究員們在各個智能體之間建立了高效的通信機制,通過協調智能體之間的利益分配與轉移,來促進智能體之間的合作,同時協調他們之間的競爭,最終起到全局優化的目的。
據劉鐵巖介紹,通過競合多智能體強化學習技術,可以做到航運路徑優化的時間減少至毫秒級。每個智能體的局部運算可以并發進行,傳統運籌學方法需要好幾個小時進行的路徑優化,利用競合多智能體強化學習技術則可以縮短到毫秒級。當某個智能體遇到突發狀況時,系統只需調動周圍相關的幾個智能體自己協調就能解決,無需從頭開始重新計算。
其次,自動學習、適應變化,可與環境持續交互。當某個港口停運或者某一航線發生變化時,多智能體模型可以實時獲得信息,并動態調整和反饋,快速適應新的環境。無需像傳統運籌學方式那樣,人為重寫規則,再做優化。
第三,實現預測和優化的端到端學習,消除誤差傳導。在競合多智能體強化學習中,預測環節與優化環節是一體化進行的,不需要分階段、按順序執行,因此,也就不存在誤差傳導的情況。
智能體的訓練可以利用實際運營數據,也可以通過自我博弈的方式來獲得提升。微軟亞洲研究院為此設計了復雜的仿真系統和分布式計算框架,可以使模型訓練又快又好,目標每年可為東方海外航運節省1000萬美元的運營成本。
除了可以提高效率,新的解決方案中的每個智能體模型還可以針對港口的調度員進行模仿學習。在過去,航運調度員會根據自己的經驗對商業軟件給出的調度方案進行調整,方案的實際采用率甚至不足50%。但競合多智能體的模仿學習能力,可以學習不同調度員的行為習慣,生成更易于被調度員所接納的方案。人工智能作為助手,結合調度人員的專業經驗,將進一步提升東方海外航運的運輸調度效率。這種人工智能(AI)與人類智能(HI)的結合,也將是未來人工智能普及的常見模式。
關鍵詞: