即时配送正成为城市生活中不可或缺的一部分——点餐、买药、下单日用品,半小时内送达已趋于常态。然而,在效率不断提升的背后,配送人力却日益紧张。
无人车的出现似乎带来了新的可能,但现实约束同样明显:单家企业养一支无人车队,面对潮汐式、碎片化的订单,常常陷入“大马拉小车”或“小马拉大车”的窘境——要么车辆闲置,要么爆单瘫痪。
于是,行业开始尝试一种新玩法:把多家企业的无人车整合到一个开放平台上协同配送,以联盟形式“共享运力”。
达达快送在2021年7月作为开放平台成立,整合了京东与Rino.ai的无人车队,专门承接O2O生鲜的当日达业务;中通快递也于2023年4月与新石器达成战略合作,推进无人配送的规模化部署。
这些尝试都指向同一个愿景:把蛋糕做大,大家一起多赚钱。
理论上,几家企业把无人车、订单、数据汇到一起,效率一定优于各自为战。但现实却是——企业愿意"借车",却不愿意"借数据"。订单流量、区域密度、用户画像,这些都是企业的命脉。
协同配送陷入了典型的困境:不共享信息,联盟效率上不来,总蛋糕做不大;共享信息,效率确实提升了,但共享者又担心自己多付出、别人多分钱。过去几十年,合作博弈论的研究者们设计了各种收益分配方案,但几乎都只盯着两件事——谁出了订单、谁出了车。没有人把“谁贡献了高质量信息”也算作一份功劳。
一个根本问题也浮出水面:谁愿意将核心运营信息全面共享?如果各方都选择保守,联盟如何实现高效运转?而即便实现共享,收益又应如何分配,才能兼顾公平与激励?
大连理工大学的研究团队近期在交通物流领域顶级期刊《Transportation Research Part E: Logistics and Transportation Review》发表了题为How shared information contributes: A novel revenue allocation method for collaborative instant delivery with unmanned vehicles的研究成果。他们提出了一种基于贡献的收益分配方法,首次将“共享信息的价值”量化并纳入分配机制,试图回答这个核心问题:在信息不完全共享的协同配送环境下,如何实现公平分配,能激励各参与方主动共享高质量信息?
论文链接:https://doi.org/10.1016/j.tre.2025.104274
多家物流企业组成联盟,各自拥有无人车队。在理想状态下,各方可以将订单信息、车辆位置、配送成本及路径规划等关键数据全面共享,由中央平台统一调度——这类集中式协同在理论上能够实现最高效率。
然而在现实中,这种模式难以落地。运营成本结构、车辆调度策略、订单利润水平等均属于企业核心商业机密,一旦完全共享,几乎等同于向竞争对手暴露自身运营逻辑。
与之相对的是另一种极端——分散式协同:各企业保留全部调度权,仅通过拍卖等机制交换少量订单。尽管隐私得以保障,但整体决策效率较低、响应滞后,难以满足即时配送“分钟级响应”的业务需求。
于是行业陷入一个两难局面:合作能带来整体效率的提升,这一点在理论上并无争议;但具体到每一家企业,是否率先、充分地共享信息,却需要承担不对称的风险。
如何在信息保护与协同效率之间取得平衡,成为协同配送机制设计中的关键问题。
针对这一难题,研究团队提出了一种半集中式协同模式:中央平台仅负责订单分配与收益计算,不直接干预企业的车辆调度。无人车的路径规划与排班安排,完全由各企业自主决策。
与此同时,平台所能获取的信息,取决于企业自身的信息披露偏好。论文将信息共享划分为四个等级:
企业可以根据自身策略,自主选择披露程度。平台则基于这些信息,对各企业的配送成本进行动态估计,并将上传订单分配给估计成本最低的企业,随后依据贡献进行收益分配。
在订单决策层面,企业需要判断哪些订单由自身完成,哪些应上传至平台。为此,论文设计了一种基于边际成本的决策规则。
每家企业内部运行带时间窗的取送货优化模型,该模型基于企业完整的运营信息(包括订单集合、车辆位置及实际行驶成本等),能够评估新增订单插入当前配送路线所带来的额外成本。企业据此将这部分新增成本与订单收入进行比较:只有当新增收益高于新增成本时,才选择自行配送,否则将订单交由平台处理。
在此基础上,企业还会持续利用该模型对配送方案进行动态优化。每当获得新订单(无论来源于自身还是平台分配),模型都会重新计算路径,将新订单嵌入既有配送计划中,不断更新最优行驶方案。
这一机制在保留企业调度自主权与信息选择权的同时,也为平台进行全局优化提供了必要的信息基础。
然而,一个关键问题仍然有待回答:企业所共享的信息,究竟应如何定价?其价值又该如何量化?
图:无人车协同即时配送示意图
信息价值量化与收益分配:沙普利值+三方贡献
在经典合作博弈中,Shapley Value(沙普利值)常用于衡量个体对联盟的边际贡献。通俗地讲,它问的是这样一个问题:如果让联盟成员按随机顺序依次加入合作,每个人加入时能给团队多带来多少增量价值?把所有可能的加入顺序都算一遍、取平均,就是这个人应得的那份钱。
它是合作博弈论里唯一同时满足有效性、对称性、零贡献者性和可加性四条公理的分配方案,被视为“公平分配的金标准”。
研究团队将其引入信息价值评估问题,用以刻画企业共享信息对整体决策的影响。具体思路是:通过比较“包含某企业信息”与“剔除该企业信息”两种情形下,平台订单分配结果是否发生变化,来判断其信息是否具有价值。若决策结果发生改变,则说明该企业的信息对系统优化具有贡献。
在计算上,首先基于所有企业共享信息的情形,求解系统的总估计运营成本;随后依次移除某一家企业的信息,并重新计算成本。两者之差即为该企业信息的边际价值。当多家企业均提供有效信息时,对这些价值进行归一化处理,得到各企业的信息权重,并用于后续收益分配。这一设计首次在协同配送收益分配中,将“信息”显式转化为可量化的贡献维度。
与企业侧模型类似,平台同样采用带时间窗的取送货优化模型进行成本估算,但其信息来源仅限于企业自愿披露的有限信息(L1–L4),无法获取真实运营数据。不同信息披露等级对应不同的估算方式:
信息越充分,平台的成本估计越准确,相应的订单分配效率也越高。而前述“剔除某企业信息前后的成本差值”,正是基于这一估算体系得到的。
在此基础上,平台进入收益分配阶段。联盟总收益被划分为三部分:
整个分配机制的目标,是在最大化联盟整体预期利润的同时,确保每个企业参与联盟所获得的收益不低于其独立运营水平——也就是博弈论里所说的“个体理性约束”。
图:半集中协作模式下,中央决策平台与具有四种不同信息披露偏好的承运商之间的交互示意图
算法落地:自适应大邻域搜索实现实时分配
上述理论设计在实际落地过程中还面临一个工程挑战:订单数量、车辆资源、时间窗约束以及延迟惩罚等因素相互耦合,使得问题规模复杂且难以精确求解。
研究团队为此采用了“自适应大邻域搜索算法(ALNS)”,并结合协同配送特性设计了专用的破坏与修复算子。破坏算子包括随机移除、基于利润优先的低价值订单移除,以及基于相似性的Shaw移除策略;修复算子则包括贪婪插入与Regret-2插入策略。算法在迭代过程中根据历史搜索表现动态调整各算子的选择权重,从而不断提升解的质量与稳定性。
实验结果表明,该算法在不同规模问题上均表现出良好的适应性与求解效率:
对于即时配送这类典型“分钟级决策”场景而言,该求解效率已具备良好的工程适用性。
实验结果:多共享,多获利
研究团队设计了多组数值实验,涵盖4家企业、不同的信息披露偏好组合以及30个决策周期(每个周期8分钟)。核心发现如下:
第一,信息共享确实能提高利润,而且是阶梯式的。在所有异构场景中,共享信息质量更高的企业,其平均利润增长更为显著。从L1到L4,利润增长呈明显上升趋势——不共享信息的企业利润增长最低,而随着信息披露程度提升,企业获得的利润增长也呈上升趋势。这表明,信息披露策略与联盟整体收益之间存在显著关联,且信息共享越充分,通常越有利于收益提升。
第二,环境结构影响共享策略的收益表现。在低透明环境下(多数企业信息披露程度较低),适度共享位置信息往往优于过度披露,因为平台可获取的信息有限,过度细化反而可能导致次优分配。而在高透明环境下(多数企业充分共享信息),若企业披露水平过低,则可能被联盟边缘化;只有同步提升信息披露程度,才能获得更多订单分配与更高收益。从管理启示来看,在低共享环境中“适度披露”已具备较优性,而在高共享环境中则需“同步跟进”。信息披露从来不是一个绝对策略,而是一个相对策略。
第三,上传订单越多,企业利润总和越高。随着订单上传保底比例的提升,更多订单被纳入联盟协同优化体系,从而提升整体调度效率,并带来企业利润总和的增加。
图:四种异质信息共享情景下不同信息披露偏好对应的平均利润增长与平均利润率
从“怕分享”到“愿意分享”:一套可落地的激励机制
这项研究验证了一个关键判断:即便在信息不完全、企业偏好异质的现实约束下,通过合理设计收益分配机制,仍然可以有效激励企业共享高质量信息,提升联盟整体运行效率。
文中最后也提出值得进一步深入的研究方向:
跳出研究的技术细节来看,这项研究所揭示的,其实是一种更深层次的认知转变:
行业发展的瓶颈,未必仅来自技术能力的不足,更可能源于规则与机制设计的滞后。
当机制能够实现激励相容、收益可分配且风险可控时,“信息共享”不再是一种被动的让渡,而会自然演化为一种具有内在收益驱动的合作行为。
换句话说,一个高效的系统,并不依赖个体是否“愿意合作”,而在于能否让“合作本身成为最优选择”。