本文獲科技報橘
授權刊登,原文出處
眾所皆知,Uber向來很依靠數據資料,共乘服務就是建立在分析之上,並鼓勵乘客與司機為彼此評分。但Uber裡的數據科學家不只研究服務核心的功能而已,他們常常鑽研一些乘客的細節,而且能獲得意想不到的收穫。
利用貝氏機率,Uber的數據小組能夠以75%的機率準確預估乘客的目的地。他們建立了一套演算法專門用來找出特定目的地,不只是大略位置,而是準確的地址。接下來,他們拿來在 3,000名不具名Uber乘客身上測試。
Uber的Ren Lu為我們公開他們的公式是如何運作的:
「我們取得3000名不同乘客在2014年前於舊金山的搭乘路線,為了隱私而保持不具名。每趟旅程都被乘客『標註』:當向Uber叫車時填寫目的地。我們假設這代表他們想去真正的目的地,並且創造了一個『黃金標準』,以此來與我們模型的預測做比較。」
Uber的公式採取三項變數:使用者的歷史紀錄、其他使用者的行為,與特地區域的總人口。
公式在數學上融合了所有這些「先驗機率」(統計用語)與其他因素來判斷一個用戶會去哪間酒吧或街上的咖啡廳。這對如紐約或舊金山這種人口稠密的都市來說並不容易,也是傳統反向地理解析的座標或公開位置資料庫所做不到的原因。
這個人過去做了什麼?他們常常造訪哪間特定酒吧?Uber的使用者都去哪裡?這些人口大多是做什麼的?這些都是演算法會問的基本問題。
最後,它會智慧地計算其他因素,諸如一天中的時段(人們通常不會在早上11點去酒吧)、距離(人們通常不會跑太遠)、甚至是目的地的郵遞區號(人們基本上不會喜歡走路,所以下車的地方與真正的目的地的步行距離不會太遠)。
這為什麼重要?就像其他的現代化公司一樣,Uber為了更加了解客戶,還需要多做些努力。Lu寫道:「我們的搭乘模型是Uber數據小組為了改善搭乘經驗所做的努力。這項計畫的延伸包括建構更複雜的先驗機率與可能性。
換句話說,Uber想預測的不只是你的最終目的地,有了這些實驗與模型,Uber的預測能力只會隨著時間越來越好,你的搭乘經驗應該也會越來越好。
(資料來源:FastCompany)
This entry passed through the Full-Text RSS service - if this is your content and you're reading it on someone else's site, please read the FAQ at fivefilters.org/content-only/faq.php#publishers.
Scottish readers: Undecided about the referendum? Please read How the media shafted the people of Scotland and Scottish Independence, Power And Propaganda.