2017年数模国赛B题优秀论文(省一等奖)

基于任务吸引度的众包平台定价方案优化

摘要

本文对自助式劳务平台的运营模式及运营效果进行了分析，建立多目标规划模型对定价方案进行了优化，并加入任务打包情况对此方案进行了修改，最终应用在新项目的任务定价中。

对问题一，该项目任务点分布于四个不同城市。在分析定价规律时，考虑数据的宏观分布情况，分别以各任务点与市中心距离、各任务点处会员分布密度为回归变量，以定价为响应变量，通过回归分析研究变量间的定量关系，确定回归系数后，以会员分布密度与定价的回归方程作为定价规律判定。回归方程表明：定价在宏观上与会员分布密度呈反比例函数关系。其次，在分析任务未完成原因时，分别定义任务的距离吸引度、标价吸引度来量化距离、标价对任务完成情况的影响，将任务未完成原因归结为四方面：标价吸引度低、距离吸引度低、会员分布密度低、其它因素。

对问题二，将设计定价方案的过程视为定价方与任务完成方进行博弈的过程，在博弈论的视角下对众包任务定价方案进行了设计。首先定义了定价基准值的概念，来量化任务本身的价值。根据问题一的分析结果，任务未完成原因主要是距离吸引度、标价吸引度过低，因此在定价时，从权衡各任务点距离吸引度、标价吸引度入手，分析了任务完成过程中个体的行为规律。针对任务完成方，分析了会员预定各任务的概率；针对定价方，分析了任务被预定概率、任务被完成概率，其中任务被完成概率与由会员信誉值决定的概率修正因子有关。以任务被完成概率、定价为目标，建立了无约束多目标规划模型，利用遗传算法确定了每个任务的最优定价。最后，比较了所设计方案与原方案下任务完成比例和任务标价，很好地表现出了新方案优化效果。其中新方案的任务完成率为：0.7122，标价总额为：34112.7356。

对问题三，要求修改问题二中定价模型，从而导出适用于含任务包的任务定价方案。任务打包后，对定价方案造成的影响主要是：任务包中任务个数与会员预定限额之间的矛盾。首先，在考虑会员预定限额的基础上，确定了任务包的基准价、标价吸引度及距离吸引度。受到物流配送区域划分方法的启发，建立了基于点密度的任务聚类模型对任务进行打包处理。进而类比问题二，建立了含任务包的目标规划模型，确定最优定价，并得出此定价下的任务完成概率。与问题二中任务完成率、标价总额进行对比，结果表明，将任务打包后任务完成率提高。其中打包后的任务完成率为：0.8059，标价总额为：36371.4592。

对问题四，针对新项目任务分布高度集中的特点，需要结合实际，对任务包内任务个数进行限制。基于任务个数上限，对问题三打包方案进行了改进，运用改进后的打包方案对任务打包后，通过建立含任务包的目标规划定价模型，确定了每项任务的定价。结果分析表明，在此方案下任务完成率为：0.5042。最后，加入任务开始预定时间指标，对众包任务的下发、预定、完成过程进行仿真分析，作为模型的改进。

关键词:会员分布密度回归分析吸引度目标规划任务聚类

一、问题重述

1.1问题的背景

众包是一种公开面向互联网大众的分布式的问题解决机制，它通过整合计算机和互联网上未知的大众来完成计算机单独难以完成的任务。如今，这种基于移动互联网的自助式劳务众包平台层出不穷，为企业提供各种商业检查和信息搜集，例如：阿里众包、猪八戒等。此种调查方式相比传统的市场调查方式可以大大节省调查成本，而且有效地保证了调查数据真实性，缩短了调查的周期。

“拍照赚钱”是移动互联网下的一种自助式劳动众包平台之一。用户通过下载APP，注册成为会员，然后从APP上领取需要拍照的任务（比如上超市去检查某种商品的上架情况），赚取APP对任务所标定的酬金。因此APP成为该平台运行的核心，而APP 中的任务定价又是其核心要素。如果定价不合理，有的任务就会无人问津，导致商品检查的失败。

1.2问题的数据条件

附件一给出一个已结束项目的任务数据，包含了每个任务的位置、定价和完成情况（“1”表示完成，“0”表示未完成）；附件二给出会员信息数据，包含了每个会员的位置、信誉值、参考其信誉给出的任务开始预订时间和预订限额，原则上会员信誉越高，越优先开始挑选任务，其配额也就越大；附件三给出一个新的检查项目的任务位置信息。

1.3问题的提出

(1)研究附件一中项目的任务定价规律，分析部分任务未完成的原因。

(2)为附件一中的项目设计新的任务定价方案，并和原方案进行比较。

(3)在实际情况下，多个任务因为位置比较集中，导致用户会争相选择，现考虑将这些任务结合在一起打包发布，应如何修改问题二中的定价模型，并分析对最终的任务完成情况的影响。

(4)针对附件三中的新项目的任务位置信息设计任务定价方案，并评价该方案的实施效果。

二、问题分析

2.1问题的总分析

本文首先要求我们研究已完成项目的定价规律，分析部分任务未完成的原因，其次针对部分任务未完成的原因，重新设计任务的定价方案，再次在问题二的基础上考虑任务打包的情况，修改问题二的定价模型，并分析对最终的任务完成情况的影响，最后针对新项目的任务位置信息设计任务定价方案，并评价此方案的实施效果。

本文的总体分析流程图如下：

图1.问题的总分析

2.2具体问题分析

2.2.1问题一的分析

问题一要求我们研究任务定价规律，分析导致任务未完成的原因。首先，结合附件一中的数据，需要从宏观和微观两个角度分析影响任务定价的因素，并需要对这些因素进行合理量化，可以据此描述定价规律。然后，结合定价规律分析，找到可能影响任务未被完成的原因作为指标，对这些指标进行定性和定量分析，确定影响任务未被完成的主要因素。

2.2.2问题二的分析

问题二要求我们结合问题一中任务未完成的原因，重新设计定价方案并和问题一的方案进行比较。由于众包平台本身的特点，任务预订情况无法预知，任务分配结果无法预知。因此，若在定价时未充分考虑影响任务完成的各项因素，就会出现诸如附件一中大量任务无法被完成的现象。在设计定价方案时，相当于公司与会员之间的一个博弈过程，只有充分分析并预测会员在选择任务、完成任务之中可能出现的行为概率，才能更好的设计定价方案，保证每个任务以最大的概率完成。首先，要选择合适的指标量化分析定价规律，问题的重点在于如何选取指标并进行合理量化。其次，还需从公司和会员的角度考虑，分析两者之间行为规律，选择使得任务完成比例最高且任务定价最小的点，作为双方利益最大化的平衡点作为任务的最优定价。

2.2.3问题三的分析

问题三要求我们考虑任务打包情况下的定价模型，并分析对最终任务完成情况的影响。首先，考虑任务打包的角度有很多种，受到快递配送区域划分的启发，可以根据点

密度选取初始聚类中心。其次，需要在问题二定价模型的基础上，考虑如何进行修改，建立含有打包任务的定价模型。最后，通过对比打包前后任务完成率，分析任务打包对任务完成情况的影响。2.2.4问题四的分析

问题四要求我们根据新项目的任务的位置设计定价方案，并评价该方案的实施效果。首先应该从附件给出的任务分布数据入手，判断此项目中任务的地域分布，进而设计合理的定价方案，可以考虑对上文所建立模型进行改进，确定适用于此项目的任务定价方案。

三、模型假设

假设一：附件二中提供的会员位置的GPS 信息为会员每次开始完成任务的起始位置。假设二：当会员被分配到每个任务时，其完成该任务的概率只与会员信誉值有关，不考虑除此之外的随机因素。

假设三：每位会员均在其规定的预定任务开始时间进行预定。

四、符号说明

符号

说明j w 任务j 实际定价ij

d 会员i 与任务j 距离j ρ会员分布密度j δ任务标价吸引度ij θ任务距离吸引度i

ε会员信誉值)

(j B P 任务j 被完成概率η任务完成率i

ρ点密度

注：表中未提及的符号在文中出现时进行说明。

五、模型的建立与求解

5.1问题一：定价规律分析及任务未完成原因分析5.1.1数据处理：(1)任务点分布分析

借助于智图GeoQ 在线地图[1]，绘制出任务点分布图,发现任务点分布于广州、佛山、深圳和东莞四个城市。在对任务点进行分类时，为分析定价规律，我们将任务点所属行政区域作为分类依据对任务点进行初步划分。

一般具有规则边界的区域可以借助于函数表达式完成对点的分类，而城市边界线是不规则的图形，难以用函数表达式进行描述。为简化问题，我们借助于百度地图的API 得到四个城市边界线上点的经纬度。再结合附件一中给出的任务点的经纬度，利用MATLAB 绘制出四个城市的边界曲线和任务点的示意图，并将任务点按照所属行政区域进行分类，如图2所示。(2)会员分布情况分析

利用附件二的数据，画出所有会员分布图，如图3所示。

经度

纬度

112

112.5

113113.5114114.5115

经度图2.任务点分布图

图3.会员分布图

5.1.2定价规律分析

分析公司在进行任务定价时，可能考虑的因素，如图4所示：

图4.影响定价的因素

其中道路情况，区域人口密度等因素包含很大的随机性，难以进行量化。本文主要从附件一数据入手，分析宏观的定价规律。本文从任务点位置出发，选择使用任务点与市中心距离作为定价准则一；从会员分布出发，选择使用各任务点的会员分布密度作为定价准则二。从这两点来刻画任务定价规律。

由于每个城市的任务定价受各个城市的因素影响而不同，但公司在对任务进行定价时采用的标准相同。因此，以下仅以广州市为例建立定价规律模型，其他三个城市类似。(1)影响定价的可能指标一：任务点与市中心的距离

四个城市市中心的经纬度见表1：

表1.四个城市市中心经纬度

城市

广州佛山

深圳东莞市中心经纬度

(113.28,23.12)

(113.12,23.03)

(114.08,22.07)

(113.45,23.02)

第j 个任务点距离市中心的距离为：

()[]

j j j R r ??θθ??sin sin cos cos cos arccos 0000+-=(1)

其中，j θ和j ?为任务点j 的经度和纬度，0θ和0?为市中心的经纬度。

为了分析定价规律，以距市中心距离j r 0为自变量，标价j w 为因变量画出散点图，如图5：

图5.j r 0与j w 的散点图

通过散点图及拟合效果可以看出，两变量间无明显函数关系，说明距市中心距离与定价之间相关性很弱，即在定价时，考虑的主要因素不是任务点距离市中心的距离。(2)影响定价的可能指标二：会员分布密度

由于每个任务点的会员分布密度不同，导致任务的标价不同，故计算某个任务点所在区域内会员的个数时，我们将任务点作为区域的中心。

定义任务点的会员分布密度：

m j

j πρ=

(2)

其中j m 为以任务点j 为中心，r 为半径的圆形区域内的会员个数。部分任务点的会员分布密度计算结果见表2：

表2.部分任务点的会员分布密度

任务号码A0001

A0002A0003A0004A0005A0006会员分布密度（人/km 2）8.2767.9589.8680.31815.7290.318任务号码

A0007A0008A0009A0010A0011A0012会员分布密度（人/km ）7.958

10.823

1.910

14.642

11.459

10.823

为了分析定价规律，以密度j ρ为自变量，任务标价j w 为因变量，画出散点图，如图6：

图6.j ρ与j w 的散点图

通过散点图分析，选择反比例回归模型作为分析定价与会员密度之间关系的回归模型，如下：

w j

j +=ρ(3)其中a 、c 为回归系数。

通过拟合确定回归系数后，得出回归方程表达式：

.63017.47+=j

j w ρ(4)

拟合后方差为0.09403，相关系数为0.7075，说明拟合效果良好。

(3)定价规律判定

基于拟合方差及相关系数结果表明，回归模型的显著性强，说明会员分布密度与定价之间存在较强的相关关系，因此以会员分布密度与定价的回归方程作为定价规律判定，即在宏观上，任务定价规律表现为：

.63017

.47+=j

j w ρ(5)其中j w 为任务点j 的标价，j ρ为任务点j 处的会员分布密度。回归方程表明：定价在宏观上与会员分布密度呈反比例函数关系。5.1.3确定影响任务完成情况的指标

会员在选择任务时，主要考虑两个因素：任务与会员的距离和任务标价，这两个因素对会员选择任务的影响可以理解为任务对会员的吸引程度，我们使用任务的距离吸引度、标价吸引度来量化这两个因素。(1)任务标价吸引度

从公司角度考虑，在对项目中的每个任务标价时，应满足标价不低于任务本身的价值，这个价值取决于该任务完成的难易程度。定义标价基准值j w w min 0=来量化任务完成的难易程度，即任务本身所具有的价值。

定义第j 个任务的标价吸引度为：

j j w w ?=

δ(6)

其中，0w w w j j -=?表示任务实际标价与标价基准值之间的差价，以任务的标价吸引度量化标价对任务完成情况的影响。(2)任务距离吸引度

通过上述分析知，ij d 越大表示任务点与会员的距离越远，会员受该任务的吸引程度越低，定义任务距离吸引度ij θ，易知ij θ与ij d 负相关。

通过分析可以得到一组初值条件和边界条件：当0=ij d 时，1=ij θ；∞=ij d 时，0=ij θ。由于本问题是定性分析任务对会员的吸引度，故可以任意选择满足初值和边界条件的连续函数来定性描述距离对会员的吸引度，本文选择函数表达式如下：

d ij e

θ(7)

其中，[]

1,0∈ij θ此函数表达式分析了距离吸引度的概念。5.1.4基于吸引度指标的任务未完成原因分析(1)标价吸引度过低

计算未完成任务点的标价吸引度，画出任务点与标价吸引度的散点图，如图7所示：

图7.未完成任务点的标价吸引度散点图

图7中给出313个任务点的标价吸引度信息及任务完成情况信息，从图中可以看出，未完成任务的分布与任务的标价吸引度有较强相关性，未完成任务对应的标价吸引度较低。

认为标价吸引度小于0.1的任务点的未完成原因是标价过低，从图7中，可以得到标价吸引度低于0.1的任务点共248个，表3仅给出部分标价过低导致任务未完成的任务点标号：

表3.标价过低导致任务未完成的任务点的标号

任务标号A0001A0002A0005A0008A0009A0011A0012

标价吸引度0.0151520.0076340.0076340.0076340.0151520.0076340.007634任务标号A0018A0023A0024A0025A0029A0030A0031

标价吸引度0.0151520.0076340.0225560.0370370.0151520.0441180.029851

(2)距离吸引度过低

从313个任务点中剔除(1)中标价吸引度过低导致任务未完成的248个任务点，分析剩余65个任务点中未完成任务点的未完成原因。计算剩余65个任务点的距离吸引度，画出任务点与距离吸引度的散点图，如图8所示：

图8.195个任务点的位置吸引度散点图

从图8中可以看出，未完成任务点的分布与任务的位置吸引度有较强相关性，未完成任务对应的距离吸引度较低。

认为距离吸引度小于0.5的任务点的未完成原因是任务点与会员的距离过大。从图8中可以得到距离吸引度低于0.5的任务点共13个，表4仅给出部分由于任务点与客户距离过大而未完成的任务点标号：

表4.距离过大导致任务未完成的任务点标号

任务标号A0004A0006A0037A0038A0042A0056A0063

距离吸引度0.1353050.1403980.1972370.0182720.1589690.0543510.018272任务标号A0064A0077A0078A0104A0109A0119A0121

距离吸引度0.0590360.0739530.0567140.1431910.1725490.1840250.078543

(3)会员分布密度过低

从65个任务点中剔除由于距离吸引度过低导致任务未完成的13个任务点，分析剩余52个任务点中未完成任务点的未完成原因。计算52个任务点的会员分布密度，画出任务点与会员分布密度的散点图，如图10所示：

图9.52个任务点的会员分布密度散点图

从图9中可以看出，未完成任务点的分布与任务点的会员分布密度有较强相关性，未完成任务对应的会员分布密度较低。

认为会员分布密度低于5的任务点的未完成原因是任务点周围会员分布较少。从图9中可以得到会员分布密度低于5的任务点共46个，表5仅给出部分由于会员分布密度过小而未完成的任务点标号：

表5.会员分布密度过小导致未完成任务的任务点标号任务标号A0113A0157A0191A0192A0205A0398A0404

会员分布密度0.8931 1.03620.07810.09610.0324 1.3483 4.3675任务标号A0415A0423A0427A0456A0483A0505A0540

会员分布密度 4.25740.0103 3.2576 2.6914 4.17620.09130.0736

(4)其他原因

剔除前三个原因后剩余未完成任务的任务点共6个，我们认为导致这6个点未完成任务的原因是随机因素。

综上分析，受标价吸引度影响的未完成任务的个数最多，故认为导致该项目中任务未完成的原因是任务标价过低。

5.2问题二：博弈论视角下的众包任务定价方案

由于众包平台本身的特点，任务预订情况无法预知，任务分配结果无法预知。因此，若在定价时未充分考虑影响任务完成的各项因素，就会出现诸如附件一中大量任务无法被完成的现象。在设计定价方案时，相当于公司与会员之间的一个博弈过程，只有充分分析并预测会员在选择任务、完成任务之中可能出现的行为概率，才能更好的设计定价方案，保证每个任务以最大的概率完成。

结合问题一的分析，任务未完成的原因主要有：距离吸引度低、标价吸引度低和会员分布密度低。而上述三个原因中，无法人为的改变会员分布密度，故下文从改变距离吸引度和标价吸引度两个方面考虑，确定任务定价方案。

5.2.1众包平台工作模式分析

众包的主要参与者包括公司（任务请求人）和会员（任务完成人），他们通过任务联系在一起。在本问题中，公司通过众包平台发布该项目所有任务的位置和标价，众包平台根据会员的信誉度规定每个会员的预定任务开始时间和预定任务限额，会员自己想要完成的任务，通过网络反馈给众包平台，众包平台再根据每位会员预定限额所占比例进行任务配发，即当多个会员选择同一个任务时，将该任务分配给预定限额比例最大的会员，会员接受任务后开始完成任务，将任务结果反馈给众包平台，公司通过平台审核任务，将任务审核通过的会员信息反馈给众包平台，借助众包平台向该会员支付任务金额，此APP的工作流程图如图10所示：

图10.众包平台工作流程图

众包平台按照预定限额所占比例大小分配任务，例如当会员B0001～B0005选择了同一个任务A0540，且五位会员的预定限额比例由大到小排序为：B0002＞B0003＞B0001＞B0004＞B0005，众包平台根据预定限额比例大小将任务分配给会员B0002。5.2.2定价方案设计准备：博弈过程分析

在定价过程中，会员作为任务完成人构成一个群体，我们需要对该群体的行为进行深入研究，达到对个体行为预测的目的，才能更好的与其他个体进行博弈。在本问题中博弈双方为；公司和会员。

在设计定价方案的过程中，需要从公司的角度去分析会员个体的行为，得出每个会员个体对每个任务的综合作用效果，从此综合效果入手，确定最终的定价方案。(1)综合标价与距离的任务吸引度指标

当公司在众包平台发布任务信息后，会员为了能够完成任务且得到更多的任务奖金，故会优先选择距离自己较近且标价高的任务点，即会员预定任务的概率与任务标价吸引度正相关，与任务距离距离吸引度负相关。

为了综合描述标价和距离对会员的吸引度，首先对标价吸引度和会员吸引度的数值进行归一化处理，然后定义任务吸引度为：

j ij i G δωθω21+=(8)由5.1.4中距离吸引度和标价吸引度过低导致的任务未完成的任务的个数，可以得

到综合描述吸引度的权重，计算方法如下：

4009

.01==未完成的总数

距离与标价导致的任务的个数

距离导致的任务未完成ω(9)同理得到，5991.02=ω(2)个体行为分析：会员预定任务概率

站在任务完成方的角度，第i 个会员在预定任务时，对每个任务都以特定概率去预定，记为()j i T P 。当任务与会员的距离越近，标价越高时，会员预定该任务的概率越大，即该任务对会员的标价吸引度和距离吸引度越大，会员预定此任务的概率越大。

假设i M 表示第i 个会员的位置，j T 表示第j 个任务的位置，图11给出会员i 周围任务点分布及会员预定每个任务点的概率()j i T P 的示意图，其中任务点的距离吸引度从

大到小依次为：1751T T T T T T T l m l l n l >>>>>>+++，任务点的标价吸引度从小到大依次为：

m l l n l l T T T T T T T +++>>>>>>1751，那么会员预定任务点1+l T 和5T 的概率较大。

图11.会员i 周围任务点分布示意图

第i 个会员对第j 个任务的预定概率为：

()()

i i j i G P T P =(10)

即会员预定任务概率是关于ij θ与j δ的函数。容易想象，会员预定各任务的概率与任务吸引度正相关，即某项任务的吸引度越大，会员预定该任务的概率越大。

对于本问题只是定性的分析会员预定任务概率，不需要确定具体的函数表达式，且最终在定价时，是对会员预定概率进行优化使其尽可能的大，不关心其具体函数值。故只需统一确定每个会员预定任务概率的计算标准，即有一个统一的函数表达式即可。所以本文选择：

()i

j i G T P =(11)

(3)任务被预定的概率

站在定价方的角度，考虑在实际预定过程中，对某个特定的任务，每位会员都会以一定的概率预定此任务，但我们关心的是此任务最终被预定的概率。假设ij A 表示第j 个任务被第i 个会员预定，那么该任务被预定的概率为()ij A P 。图12给出任务点j 周围会员分布及该任务被会员预定的概率：

图12.任务点j 周围会员分布示意图

在实际过程中，每位会员都可能会预定此任务，易得该任务被预定的概率等于会员选择该任务的概率，即()()j i ij T P A P =。(4)任务完成概率

在实际会员完成任务的过程中，某个任务的预定概率较大并不能说明该任务会以此概率被完成。因为每位会员的信誉值不同，导致会员完成该任务的概率小于该会员预定此任务的概率。以下我们考虑受会员信誉值影响下的任务完成概率，设第i 个会员完成第j 个任务的概率为：

()()()i ij ij f A P B P ε+=(12)其中，()ij B P 表示第j 个任务被会员i 预定，且会员i 去完成此任务的概率，()i f ε表

示修正因子，与会员i 的信誉值相关，本文定义()i f ε：

()i

i f εε1

=(13)

其中i ε表示第i 个会员的信誉值。

根据众包平台在分配任务时的分配原则，要使任务完成的总数越大，在分配任务时应选择对应任务完成概率最大的会员，因此可知任务的完成概率：

()()ij j B P B P max =(14)

由于实际情况下每位会员都存在预定第j 个任务的可能性，因此()j B P 的实际值会略大于公式(13)的估计值。

(5)任务完成概率与任务完成结果的关系

根据上文分析，确定附件一中每个任务点的被完成概率，结合每个任务点的完成情

况，分析任务完成概率与任务完成结果之间的关系。确定任务完成概率阈值，以任务点的完成概率()j B P 为横坐标,每个任务点的任务执行情况为纵坐标，绘制出完成情况与完成概率的图像，如图13所示：

图13.任务完成情况和完成概率关系图

通过图13可以看到，当()5.0≥j B P 时，任务完成个数与附件一中任务完成个数最为

接近，故可以将此值作为任务完成阈值，即当()5.0≥j B P 时，任务一定被完成。5.2.3基于任务吸引度的目标规划定价模型

根据上述分析，该定价模型需达到提高任务完成比例、降低任务标价花费的目的，即使得所有任务的标价最小，任务完成概率最大，因此可以建立无约束多目标优化模型，求解每个任务点的最优定价。

第j 个任务的无约束优化模型如下：

w f =1min ()

j B P f =2max 对每个任务点，求解此无约束优化模型，确定每个任务点的最优定价。以A0034任务点为例，求解该任务点的最终定价的非劣方案。

图14.

多目标任务定价模型得到的是权衡博弈双方的任务定价的非劣方案。统一标价及任务完成概率的非劣方案选择标准后，得到所有任务点的定价及完成概率，见表6：

表6.每个任务点的最优定价及完成概率

任务标号

A0001A0002A0003A0004A0005...A0835非劣定价70.8663.3468.6168.4269.62...88.47非劣完成概率0.431

0.974

0.650

0.831

0.422

...

0.711

5.2.4结果分析：方案比较

由于5.2.2中的模型是针对任务标价和任务完成概率进行优化，故在与原方案进行比较时，选择任务总标价和任务完成比例这两个指标进行比较。

通过比较5.2.3中求得的最优任务完成概率与阈值0.5的大小，确定任务完成个数。如下可定义任务完成率为：

任务总数

已完成的任务个数

η(15)公司完成该项目所需的花费，即任务总标价为：

∑==835

1j j

w W (16)

利用公式(15)(16)计算得到原方案和新方案任务完成率和公司所需花费如表7所示：

表7.原方案与现方案的任务完成比例及任务总标价

方案任务完成率任务总标价原方案0.625136446现方案

0.7122

34112.7356

结果表明，设计的任务定价方案有效提高了任务完成率，且任务总标价更低，体现了新方案的优势。

5.3问题三：考虑任务打包情况的定价方案修订5.3.1基于点密度的任务聚类模型

对目前快递配送现状进行了分析，受到快递配送区域划分的启发，快递配送在划分配送区域时，根据点密度选取初始聚类中心，基于这个思想本文对打包方案及算法做出如下设计。(1)点密度

假设i Q 为包含856个任务点区域内的任意一点，这里考虑以500米作为打包半径为例进行后续分析。以i Q 为圆心，做半径为500米的圆，该圆内包含的任务点个数记为i q ，如下可定义i Q 的点密度：

i q =ρ(17)

图15为以500为打包半径的一个任务打包示例，此任务包含任务号码为：A0262，A0239，A0253，A0257，其中圆心点密度为4。

图15.任务打包示意图

(2)打包方案算法设计

设在未打包前的任务标号构成的集合为0G ，计算该区域内任意一点i Q 的点密度i ρ，对点密度进行排序，找到使得1>i ρ且最大点，记为0Q ，从0G 中删去0Q 所对应的圆内的0q 个任务点的标号，得到新的任务点标号集合，记为1G ；重新计算该区域内任意一点的点密度并对其进行排序，找到使得1>i ρ且最大点，记为1Q ，从1G 中删去1Q 所对应圆内的1q 个任务点的标号，得到新的任务点标号集合，记为2Q ，依次进行下去，直到该区域内任意一点的点密度1≤i ρ，此时的任务点集合为1+m G 。

由上述搜索算法得到的区域内的点：m Q Q Q Q ,,,,210 就构成了任务包中心点集合，由m ρρρρ,,,,210 就构成了以i Q 为中心的任务包所包含任务点的个数的集合；点密度

1≤i ρ的任务点标号构成的集合1+m G 为未被打包的任务点的集合。

那么确定打包方案为由打包的任务和未打包的任务构成，即m G G G G ,,,,210 和1

+m G 中的所有元素。

算法流程图如下：

图16.打包算法流程图

5.3.2任务包定价方案分析(1)可预订任务包会员集合

由于会员受到预定任务限额的限制，当众包平台将任务包的信息发布在APP 上后，只有会员预定任务限额大于任务包内任务总数的会员才可预定该任务包，那么容易知道可以预定该任务包的会员个数相对于未打包前可以预定该包内任务的会员数减少。以下为方便分析，我们定义当该任务包内所含任务个数为k 时，可预订该任务包的会员构成的集合为：

{}k b a D i i k ≥=(18)其中，i b 表示第i 个会员的预定任务限额，i a 表示第i 个会员的标号。

根据附件二中的数据，表8给出当k 分别为10,20,30时，可以预定该任务包的会员

编号：

表8.可预订任务包的会员个数

任务包内任务个数

可选择该任务包的会员个数

10292201073057

(2)任务包基准价

不妨设该任务包含有k 个任务，根据问题一中任务基准价的定义得到含有k 个任务的任务包的基准价为：

j k w k w min 0?=(19)

其中j w 为未打包前每个任务的标价，即根据问题二中的定价模型得到的每个任务的标价。

(3)任务包标价吸引度

与问题二中任务的标价吸引度计算方法类似，任务包的标价吸引度为：

k w w w 0-=δ(20)

其中，k w 表示该任务包的实际定价。(4)任务包距离吸引度

由于问题二中，任务距离吸引度的计算公式只适用于单个任务点，因此需对单个任务点距离吸引度的计算公式进行改进得到任务包的距离吸引度计算公式，改进方法如下：

计算任务包的中心点i Q 与集合k D 内每位会员的距离ki d ，与问题一中定义距离吸引度的方法类似，得到包含k 个任务的任务包k G 对可预订该任务包的会员的距离吸引度：

ki d ki e

1=θ(21)

(5)任务包被预订概率

与问题二类似，综合任务包的距离吸引度和标价吸引度，得到任务包的吸引度为：

ki k G δωθω21+=(22)

在定性分析时，任务包的预定概率为：

()k

k G A P =(23)

(6)任务包被完成概率

根据上文的任务包定价方案分析，将任务包视为单个任务点，重新对未被打包的任务点和任务包进行编号，重新编号后的任务集记为：*j T 。

由上文可知，只有当会员的预定任务限额大于等于任务包所含任务的个数时，可预订该任务包，即含有k 个任务的任务包对集合k D 以外的会员的吸引度为0。

类比问题二中任务未打包时个体行为的分析方法，首先从会员角度考虑，确定会员预定任务的概率为：

()i j i G T P =*(24)再从公司角度考虑，任务被预定的概率等于会员预定此任务的概率，即

()()*=j i ij T P A P ，得到任务被完成的概率：

()()()

i ij ij f A P B P ε+=(25)

其中，()i

i f εε1

=，i ε表示第i 个会员的信誉值。

5.3.3含任务包的目标规划定价模型

将任务打包后，任务包即视为一个任务点，将所有任务包与未打包任务点组合，并重新编号，类比问题二中不含任务包的定价模型，建立如下含任务包的多目标规划模型：

j w f =1min ()

j B P f =2max 最终定价的非劣方案，结果见下表：

表9.部分任务包定价及被完成概率

任务包编号

任务包内任务个数

任务包定价任务包被完成概率

111965.86040.54136524231.65920.86428634272.64220.58632343

224.0409

0.927164

5.3.4结果分析

分别计算打包前后的任务标价总和、任务完成率，如表10所示：

表10.打包前后任务完成率与总标价

方案任务完成率任务总标价未打包的定价方案0.712234112.7356

打包后的定价方案0.805936371.4592

通过上表可以看出，打包后的任务完成率有所提高，但是任务总标价比未打包时的定价方案高，说明在此种定价方案设计中，可有效提高任务完成率，但对标价和的优化效果不佳。

5.4问题四：新项目定价方案设计

5.4.1基于任务个数上限的打包方案改进

(1)任务包内任务个数上限：

借助于智图GeoQ在线地图得到附件三新任务点的分布图，发现任务点分布在广州市、佛山市和深圳市。

图17.新项目任务点分布图

从图中可以看出，该项目的任务分布高度集中，若仍然依据问题三中的打包半径，会使任务包中任务个数很大，完成耗时长，被完成概率低。因此，对问题四，在给出定价方案时，若要采用任务打包策略，不能使用问题三中的打包半径及打包方案，而首先需要根据实际任务的完成耗时，确定任务包中任务个数上限，进而确定合理的打包半径。由于未给出有关任务耗时的信息，所以无法定量分析任务个数上限，为给出定价方案，以15为例，作为任务个数上限。

(2)受任务个数约束的打包方案分析：

给定任务个数上限后，即可使用基于点密度的任务聚类模型，对新项目的任务点进行聚类打包。做如此打包处理后，即可使用问题三中含任务包的目标规划定价模型。

5.4.2改进打包方案后的目标规划定价模型

附件三中仅给出新项目任务点的位置，无任务标价信息，故假设该项目任务的标价

基准值为0w ，任务标价实际值为j w ，那么定义带有未知参数的标价吸引度为：j

j j w w ?=

δ类比问题三，建立如下含任务包的多目标规划模型：

j w f =1min ()

j B P f =2max 求解此模型得到，未打包任务和任务包的定价及完成概率的非劣解。5.4.3结果分析：基于任务完成率的实施效果评价

由于标价基准值未知，上述模型无法进行求解，因此以650=w 为例，确定最优的单个任务和任务包的定价及完成概率，结果见表11所示：

部分结果如下表：

表11.改进打包方案后的任务定价方案

任务包编号

任务包内任务个数

任务包定价任务包被完成概率

113948.98460.493162210611.49410.949166310487.45680.7000864

530.8435

0.805416

此时的任务完成率为：5042

.0=η六、模型的改进与推广

6.1模型的改进：仿真方法分析

本文在分析任务分配的过程中，未考虑每个会员开始预定时间的差异。实际上，由于任务的分配原则，预定开始时间晚的会员在预定任务时会受到之前预定此任务会员的影响，即在实际过程中，会员预定各任务的概率是随时间变化的。

在会员预定任务时，发现已经预定此任务的会员人数较大，就会导致该会员预定此任务的概率变小，且该会员会更倾向于选择已经预定人数较少的任务。该现象表明，会员预定某个任务的概率与其预定时刻任务点已有预定的会员数具有负相关性。

如图11所示，当任务点m j j j j T T T T +++,,,21对会员i M 的距离吸引度和标价吸引度相同时，此时刻任务点已有预定的会员数从大到小依次为：12+++>>>j m j j j m m m m ，那么该会员选择任务点时的概率从大到小依次为：j j m j j P P P P >>>+++21，该会员更倾向于选择任务1+j T 。