货拉拉KDD2021论文详解 MoD系统中信息披露的优化方法 (货拉拉叫车)

文章编号:40713 资讯动态 2024-12-03 货拉拉

近日,国际数据科学和数据挖掘领域的最顶级学术会议KDD入选论文正式揭晓。今年KDD吸引了全球范围内705篇论文投递,仅收录了138篇论文,收录率不足20%。货拉拉论文《Improving the Information Disclosure in Mobility-on-Demand Systems》(《一种MoD系统中信息披露的优化方法》)从705篇论文中脱颖而出成功入选。该论文通过数据建模解决互联网物流智能分单问题,提升互联网物流平台效率,实现业务指标优化。

本文对货拉拉论文《Improving the Information Disclosure in Mobility-on-Demand Systems》进行详细解读。货拉拉技术团队该论文中提出了一种优化信息披露方式的框架,通过建模和求解,通过算法选取最合适的司机进行履约,实现订单的精准推送,实现平台效率、用户体验和司机体验的整体提升。

一、研究背景

当下货拉拉货运采用的订单分配方式为全局广播,即在指定时间/距离 等范围内,将所有订单推送给所有司机,司机通过浏览订单列表的方式,做抉择,选取符合预期的订单进行响应,对于同一订单被多个司机响应的场景,由算法综合考虑平台效率、用户体验、司机体验等因素,选取最合适的司机进行履约。

定义订单推送给司机为一种信息披露,本论文提出的算法便是在订单广播环节提出的改进。

作为司机,处于不同的状态(时空,供需,今日累计工作时长,今日累计收入等),面对不同的选择(订单列表),对收入的期望也会有所差异。

举几个例子:

1) 供给受限的情况,待匹配订单数远远大于运力数

司机相对主动,倾向于接价格更高的订单;

2)需求受限的情况,待匹配订单数远远小于运力数

司机相对被动,倾向于选择不空驶,尽量不计较价格;

3)无限制的播单场景,司机的订单列表里有全城,甚至是全国的订单

司机相对主动,在系统订单过剩时,会选择困难;

4)强限制的派单场景,司机的订单列表里不超过一个订单

司机相对被动,在系统没有派单/派单不满意 时,会有焦虑感;

通过对司机的决策行为进行准确地估计,并通过优化信息披露(哪些订单给哪些司机看)的方式,我们期望实现司机体验、用户体验和平台效率的整体提升。

二、研究价值

1、区别于传统的推荐系统,例如抖音,豆瓣,淘宝等,电商网站的商品,以及短视频等内容,相对来说是一个不受限的资源,即一个商品可以被成百上千个用户购买,一条视频可以被推荐给千千万万的用户。

货拉拉场景:订单因时空问题,会被推送给有限个司机;司机因屏幕问题,只能浏览有限个订单。这一类带资源约束的问题,目前没有成熟有效的解决方案。

2、区别于传统的派单模式,众包业务的播单模式引入了更多的运力保障。

a、引入了更多的复杂度

对于m个司机,n个订单的业务场景

派单解决的是1vs1的匹配问题,播单解决的问题是n vs m的信息披露问题

纯暴力的搜索空间:

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

随着问题规模的不断变大,其对应复杂度呈指数增长。

b、引入了更多的司机竞争

不管是供给过剩,还是需求过剩的场景,司机对某一类订单的偏好比较一致,例如高价格、高小费等属性,导致该类订单响应的司机数多,而订单最终只能由一位司机来履约,势必产生很多的无效司机选择,导致平台整体效率降低。

三、算法框架

1、预测

基于业务场景下的条件依赖,我们拓展了Multinormal Logit Model,将司机的决策分两步来估计:

a、司机选择接单,或者不接单

b、司机选择候选列表中的某一订单进行响应

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

通过在历史行为数据上做最大化对数似然估计,我们对模型的参数进行拟合:

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

可以逐级来分析建模的合理性:

1)第一级,司机看到某个订单列表,有一定的概率会选择不接单,如果当前的列表他不满意,他会等待,直到在未来的某个时空出现满意的候选订单列表;

2)第二级,司机认为当前订单列表满意

i) 会从中选取最偏好的订单响应;

ii)基于此候选订单列表,如果减少订单o的信息披露,则司机对于其他订单 o'的接单意愿会提升,而司机对于第一级的 不接单的概率也会提升(第一级的满意度降低)

2、规划

a、目标函数

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

b、问题求解

i、全局的信息披露

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

ii、局部的信息披露

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

iii、原始的砍边算法

iv、最小化损失的砍边算法(Minimal Loss Edge Cutting)

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

整体算法如下:

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

3、实验

a、离线:

选取货拉拉平台上3个城市的历史数据,训练司机决策预估模型

b、在线:

选取货拉拉平台上3个城市的若干时间段,按照分组轮换做AB实验

A:货拉拉现有的全局信息披露方式

B:基于司机决策预估模型的$$MLEC$$算法框架

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

解整体的局部供需问题

货拉拉KDD2021论文详解:MoD系统中信息披露的优化方法

《Improving the Information Disclosure in Mobility-on-Demand Systems》论文提出了一种优化信息披露方式的框架,通过建模和求解,实现业务指标的优化。这项研究不仅适用于货拉拉这种互联网物流平台,同样也可应用于带资源约束的推荐系统。

版权文章,未经授权禁止转载。详情见 转载须知 。


本文地址: https://www.gpxz.com/article/3b3f5a7ad07e1ad86470.html
全局中部横幅
全局中部横幅
求职

智联招聘求职招聘网站,为求职者提供2026年真实准确的全国求职招聘信息,海量的高薪职位招聘信息供求职者选择,找工作就上智联招聘!

vivo智能手机官方商城

vivo官方商城-提供vivo、iQOO最新款智能手机/原装配件购买,专业影像旗舰vivoX80系列、折叠屏旗舰vivoXFold、大屏商务旗舰vivoXNote、vivoS12、X70系列、iQOO9Pro、iQOONeo6等,同时提供手机以旧换新、镌刻服务及售前售后支持.

至邦科技

至邦科技,3c数码垂直领域

海南监控安装

海口烁达网络科技有限公司长期从事弱电行业安防系统,包括视频监控,电脑维修,门禁系统,防盗报警,智能门锁,组装电脑,综合布线,电信宽带,订餐系统,网络布线,企业外包,电脑/外设,楼宇对讲,海口烁达电脑公司,海口电脑维修专业上门服务!50元上门维修电脑,修不好不收费。

福州定制衣柜

520魔方空间是集设计、生产为一体的全屋定制品牌,主营:定制衣柜、定制橱柜、定制家具、木门定制等整体家具全屋定制厂家,欢迎您来电咨询!

山东国槐

嘉祥县丁玉龙苗圃专于国槐的繁育、推广、及景观园林的应用,成为国槐生产、交易集散地。本基地常年供应【国槐小苗3、4、5、公分、国槐树苗6、8、10公分、国槐树12、15、18公分、大国槐20、30、40公分,】等大小规格国槐,金枝国槐、龙爪槐、千头椿、法桐,合欢,白蜡,垂柳等绿化苗木,国槐,质量好,发货快,种植好成活。

iApp世界网

iApp世界网是一个开放的iApp交流平台,这里汇聚了iApp相关的教程、源码、布局、作品等资源,你可以在这里分享你的经验心得,与更多的iApp开发者一起交流技术,提高自己的水平,写出更完美的作品。

鱼鱼玩

鱼鱼玩是一款绿色安全的游戏免安装运行器,致力于提供免安装,免广告的手机游戏分享,掌握游戏市场风向标,抢先体验更多好玩魔性的精品游戏!

广州华帝热水器售后服务

【华帝热水器售后服务热线020-3848-8852】专业从事“华帝热水器售后,华帝燃气灶售后,华帝油烟机售后,华帝消毒柜售后”等华帝售后维修服务,华帝售后竭诚为您服务!

安徽码上物联网络科技有限公司

安徽码上物联网络科技有限公司,码上追防伪追溯系统多用户版

苏州安川环保科技有限公司

危废污泥减量,低温干化设备,工业废水达标排放,一体化智能废水处理设备,污泥干化机.蒸发器,分子筛智能过滤设备,钝化液智能再生设备

域名注册

三五云商城是三五互联旗下产品的线上商城,主要提供域名、企业邮箱、办公软件、虚拟主机、网站建设等服务。

全局底部横幅