货拉拉KDD2021论文详解 MoD系统中信息披露的优化方法 (货拉拉叫车)

文章编号:40713 资讯动态 2024-12-03 货拉拉

近日,国际数据科学和数据挖掘领域的最顶级学术会议KDD入选论文正式揭晓。今年KDD吸引了全球范围内705篇论文投递,仅收录了138篇论文,收录率不足20%。货拉拉论文《Improving the Information Disclosure in Mobility-on-Demand Systems》(《一种MoD系统中信息披露的优化方法》)从705篇论文中脱颖而出成功入选。该论文通过数据建模解决互联网物流智能分单问题,提升互联网物流平台效率,实现业务指标优化。

本文对货拉拉论文《Improving the Information Disclosure in Mobility-on-Demand Systems》进行详细解读。货拉拉技术团队该论文中提出了一种优化信息披露方式的框架,通过建模和求解,通过算法选取最合适的司机进行履约,实现订单的精准推送,实现平台效率、用户体验和司机体验的整体提升。

一、研究背景

当下货拉拉货运采用的订单分配方式为全局广播,即在指定时间/距离 等范围内,将所有订单推送给所有司机,司机通过浏览订单列表的方式,做抉择,选取符合预期的订单进行响应,对于同一订单被多个司机响应的场景,由算法综合考虑平台效率、用户体验、司机体验等因素,选取最合适的司机进行履约。

定义订单推送给司机为一种信息披露,本论文提出的算法便是在订单广播环节提出的改进。

作为司机,处于不同的状态(时空,供需,今日累计工作时长,今日累计收入等),面对不同的选择(订单列表),对收入的期望也会有所差异。

举几个例子:

1) 供给受限的情况,待匹配订单数远远大于运力数

司机相对主动,倾向于接价格更高的订单;

2)需求受限的情况,待匹配订单数远远小于运力数

司机相对被动,倾向于选择不空驶,尽量不计较价格;

3)无限制的播单场景,司机的订单列表里有全城,甚至是全国的订单

司机相对主动,在系统订单过剩时,会选择困难;

4)强限制的派单场景,司机的订单列表里不超过一个订单

司机相对被动,在系统没有派单/派单不满意 时,会有焦虑感;

通过对司机的决策行为进行准确地估计,并通过优化信息披露(哪些订单给哪些司机看)的方式,我们期望实现司机体验、用户体验和平台效率的整体提升。

二、研究价值

1、区别于传统的推荐系统,例如抖音,豆瓣,淘宝等,电商网站的商品,以及短视频等内容,相对来说是一个不受限的资源,即一个商品可以被成百上千个用户购买,一条视频可以被推荐给千千万万的用户。

货拉拉场景:订单因时空问题,会被推送给有限个司机;司机因屏幕问题,只能浏览有限个订单。这一类带资源约束的问题,目前没有成熟有效的解决方案

2、区别于传统的派单模式,众包业务的播单模式引入了更多的运力保障。

a、引入了更多的复杂度

对于m个司机,n个订单的业务场景

派单解决的是1vs1的匹配问题,播单解决的问题是n vs m的信息披露问题

纯暴力的搜索空间:

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

随着问题规模的不断变大,其对应复杂度呈指数增长。

b、引入了更多的司机竞争

不管是供给过剩,还是需求过剩的场景,司机对某一类订单的偏好比较一致,例如高价格、高小费等属性,导致该类订单响应的司机数多,而订单最终只能由一位司机来履约,势必产生很多的无效司机选择,导致平台整体效率降低。

三、算法框架

1、预测

基于业务场景下的条件依赖,我们拓展了Multinormal Logit Model,将司机的决策分两步来估计:

a、司机选择接单,或者不接单

b、司机选择候选列表中的某一订单进行响应

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

通过在历史行为数据上做最大化对数似然估计,我们对模型的参数进行拟合:

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

可以逐级来分析建模的合理性:

1)第一级,司机看到某个订单列表,有一定的概率会选择不接单,如果当前的列表他不满意,他会等待,直到在未来的某个时空出现满意的候选订单列表;

2)第二级,司机认为当前订单列表满意

i) 会从中选取最偏好的订单响应;

ii)基于此候选订单列表,如果减少订单o的信息披露,则司机对于其他订单 o'的接单意愿会提升,而司机对于第一级的 不接单的概率也会提升(第一级的满意度降低)

2、规划

a、目标函数

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

b、问题求解

i、全局的信息披露

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

ii、局部的信息披露

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

iii、原始的砍边算法

iv、最小化损失的砍边算法(Minimal Loss Edge Cutting)

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

整体算法如下:

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

3、实验

a、离线:

选取货拉拉平台上3个城市的历史数据,训练司机决策预估模型

b、在线:

选取货拉拉平台上3个城市的若干时间段,按照分组轮换做AB实验

A:货拉拉现有的全局信息披露方式

B:基于司机决策预估模型的$$MLEC$$算法框架

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

解整体的局部供需问题

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

《Improving the Information Disclosure in Mobility-on-Demand Systems》论文提出了一种优化信息披露方式的框架,通过建模和求解,实现业务指标的优化。这项研究不仅适用于货拉拉这种互联网物流平台,同样也可应用于带资源约束的推荐系统。

版权文章,未经授权禁止转载。详情见 转载须知 。


本文地址: https://www.gpxz.com/article/3b3f5a7ad07e1ad86470.html
全局中部横幅
全局中部横幅
悟空归来游戏在线玩

手机悟空归来h5,悟空归来游戏在线玩是由网易打造的一款点击+挂机式的放置类HTML5游戏,游戏以西游记为题材,Q版人物,有趣的点击玩法,是十分上瘾的一款h5小游戏。;您可以免费在线玩。

源码村资源网

源码村资源网:收集各种最新最好看的网站模板下载,精品VIP网站源码等资源,免费网站源码下载!找站长模板源码交易就上站长源码村交易平台,我们坚持只收集精品,值得收藏!

团购网站导航大全

LOL网址导航网是专业的上网导航网站,精心收录各类优质热门网站信息,同时提供天气、快递、违章等各种生活便民查询工具网址,为您提供安全便捷的上网导航服务,现已被众多网友设为上网主页,网址导航大全首选LOL网址导航.

中国应急救援人员关爱和矿山尘肺病防治基金会

中国应急救援人员关爱和矿山尘肺病防治基金会

湖北大学江南教育教学站

湖北大学江南教育教学站湖北大学江南教育教学站

安徽废水处理

合肥市科柏盛环保科技有限公司是一家集废水处理、废气治理、设备供应、环保工程设计施工、安装调试、运营与管理为一体专业的环境污染防治综合性公司。

太阳能光伏,太阳能发电,广东创益新能源电力,广东创益新能源电力有限公司

广东创益新能源电力有限公司是一家专注于光伏发电项目工程开发、设计、投资、工程建设、维护运维及技术咨询服务于一体的光伏企业。公司坐落于广东省佛山市南海区。目前公司业务分为三大板块:光伏工程承包、光伏项目投资和光伏应用产品销售。

117百科网

117百科网(www.117baike.com)生活常识与经验分享的综合性平台。每天为你分享有用的生活常识,推荐生活常识知识和生活经验百科大全,总结有用的知识和生活经验。

重庆万州神宇药用玻璃制品有限公司

重庆万州神宇药用玻璃制品有限公司是长江三峡库区生产新型药用玻璃包装的专业厂家,地处重庆第二大都市万州科技工业园。近邻铁路、高速公路、深水港、机场,交通十分便利,是长江三峡库区的新型药包工业企业。

岩土网

岩土网是一个面向广大岩土工程工作者的岩土工程综合门户网站,综合了岩土工程领域的技术、人才、企业、设备、材料、信息、行业研究、资金等岩土工程产业链上的各个环节,全力打造出一个

一站式汇率换算网

汇率网为您提供最新、最准确的货币汇率查询服务。我们24小时不间断更新,让您随时掌握市场脉搏,轻松进行汇率换算和追踪。无论是个人旅行还是企业金融决策,全球实时汇率网都是...

锐百科

锐百科(baikev.com)一部人人都能参与编写的中文百科全书。专注于艺术家、明星艺人、网红主播、企业品牌等百科的收录。我们立志打造一部全球专业的中文百科全书。


全局底部横幅