東南網2月23日訊 (通訊員 李玫)滴滴研究院副院長葉杰平近日在上海一場內部分享會上詳細解讀了滴滴大腦,這是外部首次窺探到較為完整的滴滴算法世界,并且一直潛水的產品“九霄”也首次露出真容。
滴滴出行研究院副院長葉杰平
滴滴大腦由三部分組成
葉杰平將滴滴大腦這個智能系統分為三部分,分別是大數據、機器學習和云計算。
其中大數據就像工業革命時代的煤一樣舉足輕重,人工智能需要數據進行訓練,縱觀應用級深度學習的成功案例,他們都獲得了海量數據,像谷歌和Facebook這樣的公司都可以獲取大量數據,這種優勢讓他們可以創造更有效的新工具。
而機器學習是人工智能的核心,一套系統通過機器自我學習的方式來實現人工智能,算法則是機器學習的關鍵要素。滴滴搭建的核心算法模型,可以幫助實現更準確的預測能力、智能的調配能力,提高效率降低成本,達到最優運力調度。
云計算提供強大、靈活的計算能力,滴滴的業務場景對計算要求和實時性都非常高,用戶輸入一個目的地,最佳合理調度都由滴滴大腦以毫秒級的速度來計算,例如通過滴滴云計算搭建了大規模實時分單處理平臺,可以實現多維度最佳訂單匹配。滴滴平臺已經有數萬臺服務器,未來兩年服務器規模將達到數十萬臺。
葉杰平揭秘的算法世界是滴滴大腦最為核心的技術之一,滴滴研究院解決的技術難題,包括供需預測、路徑規劃、智能派單等都離不開算法,此外在提高用戶乘車體驗上,也引入了人工智能,比如服務分和機器判責等功能背后都是通過復雜的機器學習算法技術來實現。
滴滴大腦每兩秒進行一次判斷,要考慮N步走法
打個比喻,每一次分單,就如同下棋,需要考慮之后N步的走法,也就是預測未來,滴滴大腦每2秒進行一次全局的判斷,在迅速的大量計算中,完成全局最優的智能派單,對于這些背后的技術,葉杰平在這次內部分享中作了詳細解讀:
1、供需預測
大數據的神奇之處就在于可以通過搜集到的數據,進行處理分析后,得到規律,然后利用這個規律來對未來進行預測。
最近比較有名的例子是一套名為MogIA的人工智能系統成功預測出川普將成為美國總統,這套亮相于2004年的系統,也曾經對以往三次總統選舉進行過成功預測。去年,開發者設計的算法又一次準確預測出了最后關頭共和黨方面取得的后起勢頭。大數據還可以預測天氣、預測地震,甚至預測你會不會生病等,而在交通方面,大數據預測的能力就極為重要,可以預測什么時間什么地方會擁堵。
大數據預測的關鍵是足夠多的高質量的數據。當前滴滴在交通領域的數據量全球第一,每日峰值訂單超過2000萬單、每日處理數據超過2000TB,覆蓋了交通路況、用戶叫車信息、司機駕駛行為、車輛數據等多個維度,它所掌握的巨大的真實數據除了幫助預測路況外,還能對供需進行預測,供需預測越準確,越能更好的解決供需不平衡問題。
滴滴目前對15分鐘后供需預測的準確度已經達到了85%,基于這樣高的準確率,平臺可以調度司機滿足未來的打車需求,有效降低未來該區域供需不平衡的概率。甚至可以暢想,有一天滴滴將能精準地知道,星期五夜晚,雨天或雪天,港麗酒店門口有多少乘客需求,附近有多少運力?
2、路徑規劃
路徑規劃和ETA兩項地圖技術是實現智能派單的關鍵,也將直接影響到司乘雙方的使用體驗。
通過海量歷史數據,可以對未來路況做預測,實現A點到B點的路徑規劃,它是派單的核心,工程師圍繞最低的價格、最高的司機效率和最佳交通系統運行效率來做算法。
ETA指預估任意起終點所需的行駛時間,要求精準性。滴滴是國內第一家把機器學習成功應用到ETA的公司,這是解決“訂單高效匹配”和“司機運力調度”的關鍵技術。當前滴滴ETA可以預測每一單出行的時長以及預估在每一個路口前的等待時長。有了這項技術,可以在更合適的時間對運力進行更好的調度。
3、智能派單
用滴滴叫車,和搜索的邏輯不同,網上的商品、資訊等信息都是靜態停留在那里,計算方式只是將這個商品、信息挖掘出來即可,而滴滴的計算則類似于動態打靶,車輛永遠在運動當中,要在眾多運動的車輛中,給乘客一個最優的選擇,不光是距離,時間也是。也就是實現平臺效率和用戶體驗最大化。智能派單對訂單量和司機數進行預測,然后通過大規模分布式計算來實現上述的最優撮合。
為了實現這一目的,供需預測、動調調價、路徑規劃以及服務分的算法技術要一起發揮作用,他們最終為實現最優派單而服務,他們的算法都將結合到智能派單系統中,幫助在動態環境中撮合乘客與司機的交易。
據悉,目前高峰期滴滴平臺每分鐘接收超過3萬乘客需求,每兩秒鐘作一次訂單匹配,每一次發單背后,滴滴大腦運算次數達到百億次級別。
4、服務分和司乘判責
滴滴使用大數據技術來預估每個司機的服務分值,包括乘客打分、乘客評價以及取消率等因素,并利用算法模型來計算不同服務水平的司機對用戶產生的長期影響。
滴滴在2016年9月上線服務信用體系后,司機擁有個人專屬的服務信用檔案和服務分值,為乘客提供優質服務的車主可獲得更高的服務分,從而獲得更多的訂單和收入。目前服務分已與滴滴的智能派單系統結合,在距離、車型等條件類似的情況下,系統將優先派單給服務分較高的車主,幫助服務優良的車主獲得高的收入。上述服務信用體系就是利用人工智能建立算法模型來實現,該信用體系上線后,用戶投訴率和訂單取消率都顯著下降。
保證安全體驗,服務分是手段之一,提高司機服務質量,用大數據機器學習模型來計算司機當前服務分,通過交易引擎系統來保證服務分高的司機收入越高,司機就有動力來提高服務。
除了服務分外,滴滴還通過大數據和機器學習模型來進行司乘判責。服務分里重要的幾項因素包括乘客取消訂單、投訴,以及文字評價等,需要系統來作智能判責,針對當次取消行為,判斷司機是否有責?乘客是否有責?去年12月15日全國上線了智能取消判責系統后,司機的滿意度得到顯著提高。
5、九霄
九霄是滴滴大數據孵化的出行領域智能決策的技術創新產品。能夠把錯綜復雜的時間、空間、業務維度的n次元出行領域數據,轉化成易于理解的2次元數據,搭建數據理解的橋梁;幫助運營、產品、BI、研發同學發現問題、分析問題、解決問題,產生切實的業務收益;提升業務決策效率和決策效益。
滴滴將出行領域的數據,進行整理、挖掘、智能聚合,在地圖空間和時間軸上進行合理的呈現,使用戶能夠直觀的感知在什么時間、什么地點、各個業務線的什么業務維度(乘客、訂單、運力、體驗等),發生了什么,方便深入追蹤和探尋業務痛點和原因分析。
同時,利用機器學習、數據挖掘的方法幫助運營、產品、BI、研發同學發現/分析和解決實際問題,產生切實的業務收益。舉個例子,比如通過九霄對地圖上任意區域的供需平衡狀況、訂單滿足情況能夠一目了然,并且結合九霄的精細化分析能力,能夠進行細化到某個地理圍欄的供需策略,進行圍欄級別的運力調度策略配置;(在代駕場景上)基于機器學習進行供需預測,判斷哪些區域存在運力缺口,自動化調度司機調節供需平衡。
九霄通過科學可視化技術能力、算法能力和高性能架構能力,將數據變為知識,用知識武裝決策、改變出行。
數據正在迅速生產,算法和計算平臺都需要越來越快的速度
葉杰平表示,算法世界猶如一個浩瀚的星空,沒有邊際。因為沒有一個算法是通用的,每個具體問題就需要一個算法,如何結合業務場景找到最合適的算法是一大挑戰。
“算法已經變得非常重要,隨著每天數據量迅速增大,現有算法不分晝夜都處理不完,可以說現在算法的分析速度遠跟不上數據的產生速度,算法和計算平臺需要越來越快的速度。”
當前滴滴在交通領域的數據量全球第一,每日峰值訂單超過2000萬單、每日處理數據超過2000TB,覆蓋了交通路況、用戶叫車信息、司機駕駛行為、車輛數據等多個維度,這些海量的數據信息將被利用挖掘,產生巨大社會價值。
? |