2017数学建模国赛一等奖B题论文

上传人:gbs****77 文档编号:9104623 上传时间:2020-04-03 格式:PDF 页数:14 大小:1.16MB
返回 下载 相关 举报
2017数学建模国赛一等奖B题论文_第1页
第1页 / 共14页
2017数学建模国赛一等奖B题论文_第2页
第2页 / 共14页
2017数学建模国赛一等奖B题论文_第3页
第3页 / 共14页
点击查看更多>>
资源描述
1 基于多元线性 回归 与 聚类 分析 的 网络 任务 定价 模型 摘要 随着互联网经济的高速发展 用户通过平台发布和接受任务的新型 雇佣劳 务关系 正逐渐受到年轻人的青睐 而任务 定价作为这种新型关系中最重要的一 环 其合理性也就成了吸引双方的决定性因素 因此平台若能通过用户数据分析 建立合理的定价模型向用户给出合理的推荐价格 势必能使其在强大竞争环境下 站稳脚跟 本文 根据所给数据及 问题分别建立了四个对应模型 原始定价模型 修正定价模型 打包定价模型及预测定价模型 原始定价模型建立在对 根据附件 数据的分析上 分析发现任务定价主要与三 个变量有关 供求距离 iD 消偏信誉值 iE 及总预订任务限额 iQ 相关 据此建立多 元线性回归模型 进行拟合计算任务点的预期定价 结果得到定价函数 iW iD622 2 019 0 iE iQ072 0 71 599 用得到的预期价格与实际价格进行比较并对未完成任务进行 K means 聚类分析 将未完成原因分为三类 价格过低 无人员分布及地理位置相对偏僻 修正定价模型建立在根据不同原因对三类未完成任务进行定价 改进的基础 上 对于价格过低的任务 筛选只 使用已完成任务数据进行多元拟合 以其得到 的定价函数对其进行定价修正 对于无人员分布的任务 用同样无人员分布但已 完成的离其距离最短的任务的定价作为其修正定价 对于地理位置偏僻的任务 引入常量地理位置因子 C 对其价格修正 其值为 各任务 实际 价格与用第一类修 正定价函数得到的预期定价的差值的均值 计算得出 C 5 5 打包定价模型以每个任务点为中心 将半径 1 r 范围内所有任务装入同一 任务包 再根据任务序号剔除不同任务包内的重复任务 再用原始定价模型中的 函数进行拟合 对该模型的评价采用与实际价格的 05 1 倍作为合理范围 计算 合理任务的比例作为优劣度 进行评价 发现其大 于 0 8 故认为具有可信度 预测定价模型同样采用多元线性模型 通过分析前三种模型的分析发现采用 打包定价模型的定价函数最优 用其预测新任务价格 预测结果的评价用离其最 近的已结束任务价格仿照打包定价模型进行优劣度 分析 发现具有可信度 关键词 任务定价 多元线性回归 K means聚类 任务点评价 2 一 问题背景与重述 拍照赚钱 是移动互联网下的一种自助式服务模式 用户下载 APP 注册 成为 APP的会员 然后从 APP上领取需要拍照的任务 比如上超市去检查某种商 品的上架情况 赚取 APP 对任务所标定的酬金 这种基于移动互联网的自助式 劳务众包平台 为企业提供各种商业检查和信息搜集 相比传统的市场调查方式 可以大大节省调查成本 而且有效地保证了调查数据真实性 缩短了调查的周期 因此 APP成为该平台运行的核心 而 APP 中的任务定价又是其核心要素 如果定 价不合理 有的任务就会无人问津 而导致商品检查的失败 题目 中给出了一个已结束项目的任务数据 包含了每个任务的位置 定价和 完成情况 1 表示完成 0 表示未完成 会员信息数据 包含了会员的位 置 信誉值 参考其信誉给出的任务开始预订时间和预订限额 原则上会员信誉 越高 越优先开始挑选任务 其配额也就越大 任务分配时实际上是根据预订限 额所占比例进行配发 一个新的检查项目任务数据 只有任务的位置信息 让 我们 完成下面的问题 1 研究项目的任务定价规律 分析任务未完成的原因 2 为项目设计新的任务定价方案 并和原方案进行比较 3 实际情况下 多个任务可能因为位置比较集中 导致 用户会争相选择 一种 考虑是将这些任务联合在一起打包发布 在这种考虑下 如何修改前面的定价模 型 对最终的任务完成情况又有什么影响 4 对新项目给出你的任务定价方案 并评价该方案的实施效果 二 问题 分析 1 问题一分析 针对问题一 题目要求我们研究项目的定价规律和分析任务未完成的原 因 对于前面一个问题 首先我们通过分析 把会员看做一种商品 又根据经 济学知识可知商品的价格主要受市场的供给需求关系影响 所以我们推断项目 的定价规律由拍照任务的供给和需求决定 我们把会员接的任务数当做是供给 方 拍照任务数当做需求方 当拍照任务较少而会员较多时 会出现供过于 求 则价格较低 制定的价格会较低 当拍照任务较多而会员较少时 会出现 3 供不应求 则价格较高 制定的价格会较高 接着 我们结合日常生活的经 验 选取变量 作为任务定价的影响因素 我们推断 一个任务点旁边的的会员数 量和会员离此的距离长短会都会影响任务的定价 因此我们取一个任务点方圆 1km 的会员与其的距离求 和除以 1kn 1k 为特征值 称为供求距离 作为一个变 量 然后 我们分析得到一个任务点周围会员的信誉值也会影响任务的定价 类似于供求距离的由来 我们把一个任务点周围方圆 1km 的会员信誉值依次搜 索出来求和除以 2kn 2k 为特征值 称为 消 偏 信誉值作为第二个变量 之后 我们取一个任务点方圆 1km 的会员预定任务限额求和称为 总任务限额为第三个 变量 我们认为会员任务限额也会影响市场的供求关系 我们用 MATLAB计算出 三个变量 的数据 然后结合任务定价的数据进行函数拟合找出项目的定价规 律 对于后面的问题 分析未完成任务的原因 我们先 筛选出未完成任务的数 据 找出它们的经纬度位置 定价和其周围的会员信息 然后对它们进行分 析 找出它们失败的原因 2 问题二分析 针对问题二 设计新的定价方案并和原方案比较 我们从问题一得出的未 完成原因出发设计一套新的方案使得定价更合理 问题一得出的未完成原因分 三种情况 周围有会员但定价过低 定价不低但有效识别范围内没有会员和定 价不低且有效识别内有会员但受地理位置影响而任务没有被完成 我们针对这 三种原因 分别制定不同的定价方案以此来合理定价未完成的任务 在第一种原 因下 我们认为可以用被完成的任务点的数据进行回归分析 拟合出一条直线 并写出表达式并将其作为新的定价方案 在第二种原因下 这些未完成的任务 点周围是没有会员的 因此没有可利用的数据进行分析并完成定价 然后我们 联想到那些周围没有会员却完成任务的点 并进行比对 最后我们将离未完成 任务最近的没有会员却完成的任务点的定价作为它们新的定价 在第三种原因 下 我们将定价结合了日常实际出现的情况 我们要想办法合理提高定价来消 除任务点位置偏僻带来的影响 我们认为应该在第 一问得出的任务定价函数上 加一个常数 而这个常数由任务点地理位置带来的影响决定 4 3 问题三分析 针对问题三 考虑到实际情况 出现打包的方案 让我们修改前面的定价模 型 首先 我们认为任务打包分布可以避免会员过多进行恶性竞争的现象 而 且打包可以提高任务完成的效率 然后我们队任务点的分布进行分析寻找打包 的方法 我们认为把以一个任务点为圆心 r 为半径的一个圆范围内的所有任 务看作是一个任务包 已经被归纳入任务包的不进入下一次搜索 接着我们队 任务包进行定价 从原始任务点出发对任务 包定价 一个任务包里面的任务定 价相同 最后 我们要分析打包对任务完成情况的影响 我们队附件一中的未 完成数据进行重新定价然后与修正预期价格模型得到的定价进行比对 进行优 劣度检验 如果优劣度 0 8 则认为打包对任务完成情况具有积极意义 4 问题四 分析 问题四考虑对新任务定价 首先在问题一 二 三所建立的定价模型中挑 选以对新任务进行预测定价 再对预测结果进行评价 评价标准采用离新任务 最近的已结束任务点的已知定价作为参考中心价格 nP 再取 5 的误差定下合理 定价范围 用预测结果进行比较 计算优劣度 若其大于 0 8 则认为该模型 定价具有一定的合理性 反之则认为模型定价效果相当较差 三 问题假设 1 假设任务是否完成与任务难度无关 只取决于是否有会员前往完成 2 假设进行任务不存在失败的情况 也就是说只要有会员前往完成任务就 被能完成 3 假设任务点之间的距离 任务点与会员的距离都是绝对距离 不考虑街 道等因素对距离带来的影响 4 假设会员对任务点的选择只考虑任务定价 距离的大小 和地理位置是否 方便 会员对任务的选择都不带有主观厌恶与喜好情感 5 假设所以会员都是理性人 6 假设数据都是来自于实际生活中完整准确的数据 5 四 符号说明 符号 符号说明 iD 第 i 个任务点的供求距离 ijd 第 i 个任务点与其周围第 j 个会员的距离 iE 第 i 个任务点的削偏信誉值 ije 第 i 个任务点周围第 j 个会员的信 誉值 iQ 第 i 个任务点的总任务限额 ijq 第 i 个任务点周围第 j 个会员的任务限额 iW 第 i 个任务点的预期定价 iW 第 i 个任务点的修正预期定价 iP 第 i 个任务的真实定价 mnd 第 个任务点的距离个任务点与第 nm C 地理位置因子 iP 重新定价 五 模型的建立与求解 5 1 问题一 定价 模型的建立与求解 5 1 1 原始定价模型的建立 我们把会员看作是一件商品 任务的定价看作是商品的价格 商品的价格受 市场的供求关系影响 即任务的定价受市场上会员的供求关系影响 按照经济学 原理任务的定价为会员供给等于 需求时的价格 对于这个问题 我们从市场的供 给与需求角度出发 建立一个新的定价模型 我们选取了供求距离 消偏信誉值 和消偏任务限额三个变量作为任务定价的因素 1 供求距离的定义与求值 我们把任务点方圆 1km 以内的会员与其的距离 ijd 求和除以 1kn 定义为任务 供求距离 iD 计算公式如下 1 1 kn j iji ndD 5 1 iD 为第 i 个任务点的供求距离 ijd 为第 i 个任务点周围 kmr 内的第 j 个会员 6 与任务点的距离模型中的距离都为绝对距离 如果考虑具体街道的话 距离很难计 算 1k 为特征值 由于附件一 二给出的任务及会员位置为经纬度分布 故在计 算距离时需要用经纬度转化求距离公式 1 设 A 点 纬度 1 经度 1 B 点 纬 度 2 经度 2 两点的距离为 12d 5 0212221221 2 c o s 1 9 9 1 1 1 5 2 平均距离一样但会员分布不同这样的对于任务定价有不同影响 如果供求距 离单纯是一个平均数 那么不论会员分布如何只要平均距离是一样的会员信息对 任务定价的影响是相同的 为消除这种情况对模型的影响 我们引入特征值 把 求和的值除以 1kn 供求距离的公式将会员信息对任务定价的影响考虑进去 是从 供给侧出发 会员与任务点的距离和任务点周围的会员数都会对供求距离的大小 产生影响 2 消偏信誉值的定义与求值 我们把任务点方圆 1km以内的会员信誉值加总求和除以 2kn 定义为消偏信 誉值 iE 计算公式如下 2 1 kn j iji neE 5 3 iE 为第 i 个任务点的的消偏信誉值 ije 为第 i 个任务点周围的第 j 个会员的 信誉值 2k 为特征值 我们 判断 会员的信誉值会影响会员的供求关系而影响价格 并且我们认为会员的信誉值是通过影响会员预定任务开始时间进而影响市场的 供给关系从而影响价格 我们利用 SPSS 对会员信誉值与会员预定任务开始时间 进行相关回归分析 发现它们存在显著负相关关系 也就是说信誉值越高的会员 通常他们开始预定任务的时间越早 回归分析结果如表 1 1所示 表 1 1 会员信 誉值与预定任务开始时间回归分析结果 平方和 自由度 平均值平方 F 显著性 标准化系数 回归 0 041 1 0 041 92 295 0 6 102 残差 0 828 1875 0 总计 0 868 1876 7 当显著值 5 0 P 则认为存在显著性相关 从结果 0 P 可以看出会员信誉 值与预定任务时间存在显著性负相关 3 总任务限额的 定义与求值 我们把任务点方圆 1km以内的会员任务限额加总求和定义为总任务限额 iQ 计算公式如下 nj iji qQ 1 5 4 iQ 为第 i 个任务点的的总任务限额 ijq 为第 i 个任务点周围的第 j 个会员的 任务限额 我们推断会员任务限额会影响市场的供求关系进而影响任务定价 4 多元线性回归模型的建立 根据上面的影响因素 iD iE 与 iQ 和题目给出的项目各个任务的预期定价 iW 建立多元线性回归模型 利用这些得到的数据拟合函数 多元线性回归模型如下 所示 iW iD1 2 iE iQ3 5 5 321 为回归系数 为常数 我们利用 SPSS求出回归系数和常数的 回归系数和常数的值要使得函数值与真实值尽量全部一样 也就是要使得尽可能 多的点落在直线上 而不 在直线上的点均匀分布在两侧 我们使用 2ii WP 来衡量模型的偏差 也就是说 我们回归模型的结果要 尽量 将 2ii WP 控制 的足够小 5 1 2定价模型的求解 我们将题目给出的数据进行分析计算 我们利用 MATLAB 计算出各任务点三 个变量的值 程序代码见附录一 完整结果见支撑材料 这里我们给出部分的结 果 8 表 1 2 变量 部分 结果 任务序号 完成情况 任务定价 供求距离 消偏信誉值 总配额 1 0 66 0 0 0 2 0 65 5 2 158 35 803 9 3 1 65 5 1 089 8939 362 6 4 0 75 0 0 0 5 0 65 5 0 413 7 552 4 6 0 75 0 247 0 194 1 7 1 65 5 1 198 21 609 5 8 0 65 5 0 868 96 954 0 9 0 66 0 094 10 676 5 10 1 66 1 280 103 498 7 在计算各任务点变量值时 我们多次改变特征值 发现 特征值 1k 0 6 2k 0 4时拟合效果更好更直观 所以我们取特征值 1k 为 0 6 2k 为 0 4 接着 我们将数据进行多元线性回归 拟合出一条直线并求出任务定价的函数表达式 我们利用 SPSS 进行多元线性回归 我们得到的多元直线函数表达式为 iW iD622 2 019 0 iE iQ072 0 71 599 5 6 iD 为第 i 个任务点的供求距离 iE 为第 i 个任务点的的消偏信誉值 iQ 为第 i 个任务点的的总任务限额 iW 为任务预期定价 回归结果如下表所示 表 1 3 多元线性回归显著性分析结果 平方和 自由度 平均值平方 F 显著性 sig 回归 1554 081 3 518 027 30 854 0 残差 11752 641 700 16 789 总计 13306 722 703 当显著性 sig 值小于 0 05 时 我们认为线性回归模型通过检验 这里的显 9 著值为 0则通过回归模型通过显著性检验 表 1 4 各系数及其显著性分析结果 1 2 3 系数 71 599 2 622 0 019 0 072 T 196 825 8 041 3 281 2 659 显著性 0 0 0 001 0 008 表 1 4 是三个变量与常数的系数值和 T 显著性检验的结果 当显著值小于 0 05时则认为该变量与项目定价存在显著性相关 这里的结果显示 供求距离 与消偏信誉值 总任务限额都存在显著性相关 并且我们得到他们的系数值 至 此 我们得出任务定价的规律 任务的定价与任务周边会员数量和离其的 距离有关 另外周边 会员的信誉值也会影响任务的定价 我们分析出会员任务的 限额也会影响任务的定价 我们还得到任务定价与各变量之间满足以下关系 iW iD622 2 019 0 iE iQ072 0 71 599 任务周边会员数量和离其的距离通过影响 iD 从而影响定价 周边 会员的信誉值影响 iE 从而影响定价 任务限额的影响通 过 iQ 影响定价 在这个模型中 我们对周边的定义为任务点周围方圆 1km 5 2 基于 K means聚类 模型 分析任务未完成原因 5 2 1 未完成 原因的分类 由于假设 不考虑任务本身难度 故任务未完成只能是没有会员接单导致任务 匹配超时自动视为未完成 将附件一中所有未完成任务的各指标数据代入原始定 价模型的定价函数 iW 求解出所有任务的预期定价 再将其与实际定价比较 发现 三种结果 1 iP iW 即 预期价格大于实际价格 该种情况相较前两种更不易观察 任 务既满足合理定价规律 又存在人员分布 故将该种情况下的未完成原因可能与 地形 交通便利程度等因素有关 故需再将该情况 下所有数据单独进行进一步分 析 5 2 2 未知 原因的 K means 聚类探索 1 K means聚类方法原理 2 K means聚类的 基本思想是初始随机生成 m 个聚类 中心 然后按照最近原则 把样本点分到 各个类别 然后计算每个类别 所以点位置的平均值 作为新的聚类 中心 不断迭代下去 直到 聚类 中心的移动距离小于某个值 将 iP iW 的所有未完成任务汇总 进行 K means聚类 具体步骤如下 1 随机生成 m 个 聚类中心 2 计算每个样本点到聚类中心的距离 将每个点聚类到离该点最近的类别中 去 我们采用的距离是欧几里得距离 对于两个数据点 11 yx 和 22 yx 计算 公式为 221221 yyxxE u c lid 5 7 3 利用得到的类别集合计算每个类别中所以点的平均值 作为新的簇中心对 于一个类别集合 nn yxyxyxA 2211 类别 A 的新中心为 yx nxxxx n 21 nyyyy n 21 4 反复进行 2 3步 直到聚类中心不再进行大范围移动 改变 m 的值 进行多次测试 发现当 m 为 3 时效果最佳 如图 1 1 所示 其 各类的聚类中心如图 1 2所示 11 图 1 1 聚类数为 3 时的聚类效果图 图 1 2 各类聚类中心经纬度 每类所包含的部分任务序号如表 1 5所示 完整聚类情况见支撑材料 三个 类别的聚类中心如图 1 2所示 表 1 5 部分聚类结果 任务序号 纬度 经度 聚类结果 437 23 47484 113 1908 类 2 167 23 23746 113 2043 类 3 436 23 37544 113 2135 类 2 224 23 39484 113 2215 类 2 240 23 39484 113 2215 类 2 658 22 91391 113 2241 类 3 107 22 67052 113 9236 类 1 102 22 65235 113 9299 类 1 考虑到未知原因可能与地 理 位置等因素有关 故在地图上搜索定位将各类聚 类中心分析其周边地理分布 定位结果的平面位置图如图 1 3 1 4 1 5 所示 12 图 1 3 类 1中心 图 1 4 类 2中心 图 1 5 类 3中心 定位结果 1 类 1中心 清平高速与 机荷高速附近 2 类 2中心 理工 职业 技术学校附近 3 类 3中心 珠江江岸附件 由于 K means 聚类的依据为离中心的距离 故各类点都应靠近其中心 分析 定位结果可知 类 1 聚集在高速公路上 位置较为偏僻 类 2 虽聚集在技校周 边 但该技校自身位置就已经较为偏僻 类 3 任务点聚集在在芳村大道南附近 即珠江边的沿江路旁 也是相对偏僻的地方 所以第三个导致任务未完成的原因 可以推测为地理位置 地理位置偏僻 人口密度相对较低的任务点越难找到合适 的接单会员 导致任务越难完成 5 2 3 未完成原因分类结论 根据对 预期价格和实际定 价的比较 以及对聚类模型的结果分析 可以将任 务未完成的原因分为三类 1 价格过低 根据原始任务的实际定价低于利用原始定价模型计算得出的 会员的预期定价 会员选择放弃接受未达期望报酬的任务 导致任务没有其接受 者 从而其结果为未完成 我们共搜索出 186个未完成任务点 具体见支撑材料 2 无人员分布 任务发布点的有效识别范围内无会员分布 导致任务没有 其接受者 从而其结果为未完成 我们搜索出了 36 个 这种原因下的未完成任务 点 具体见支撑材料 3 地理位置偏僻 任务发布点的有效识别范围内有会员分布 但任务发布 点的地理位置位于相对偏僻 人口密度低的地理位置如高速公路 机场 村庄 郊区 城外沿海或沿江路等 而任务定价与地 理位置相对优越的发布点采用同一 方案 即同一定价函数 虽实际定价大于该方案下的预期定价 但未考虑到任务 可接受者对偏僻位置的价格补偿 即会员真实的预期定价大于原始定价模型下的 预期定价 导致实际定价小于会员真实的预期价格 从而其结果为未完成 我们 搜索出了 91个未完成任务点 具体见支撑材料 5 3 修正 模型的建立与求解 在问题一中我们分析了任务未完成的原因 归纳出三种原因 周围有会员但 13 定价过低 定价不低但有效识别范围内没有会员和定价不低且有效识别内有会员 但受地理位置影响而任务没有被完成 我们认为应该针对这三种情况 分别建立 新的定价方案使得这些任务未完成的点定价 更合理 5 3 1 第一种原因下未完成任务点的新定价模型的建立与求解 我们得出的第一种原因是周围不缺乏会员但定价过低使得任务未完成 我 们使用已完成的任务点数据进行多元线性回归 利用直线拟合 得到函数表达式 再将未完成任务的变量数据代入函数表达式得出新的任务定价 也就是说 利用 未完成的任务点拟合出的直线的函数表达式为第一种原因下未完成任务的新定 价模型 类似于第一问的模型建立 我们选用了三个变量作为任务定价的影响因 素 分别是供求距离 消偏信誉值和总任务限额 由问题中的模型可知三个变量的定义与求值 供求距离 1 1 kn j iji ndD 消 偏信誉值 2 1 kn j iji neE 总任务限额 n j iji qQ 1 多元线性回归模型如下所示 iiii QEDW 321 5 8 321 为回归系数 为常数 我们利用 MATLAB计算出每个任务的 三个变量值 再利用 SPSS 求出回归系数和常数的 回归系数和常数的 值要使得 函数值与真实值尽量全部一样 也就是 要使得尽可能多的点落在直线上 不在 线上的点均匀分布在两侧 我们使用 2 ii WP 来衡量模型的偏差 也就是 说 我们回归模型的结果要使得 2 ii WP 尽量小 我们也是先求出各个任务已完成的点的三个变量数值 我们用 MATLAB 计算 出结果 程序代码和算法与第一问相同见附录一 具体数据结果见支撑材料 这 里我们给出部分数据 表 3 1 已完成任务点的变量部分结果 任务序号 供求距离 消偏信誉值 总任务限额 任务定价 3 1 089 69 585 6 0 65 5 7 1 198 28 837 5 0 65 5 10 1 280 20 152 7 0 66 0 14 13 0 711 15 569 10 0 65 5 14 1 286 13 738 0 0 66 0 15 0 720 12 831 5 0 66 0 16 1 016 12 707 40 0 66 0 17 1 734 11 896 0 0 65 5 19 0 929 10 727 10 0 65 5 20 0 587 9 645 7 0 66 0 在计算变量值时 特征值的取值与第一问相同 4 06 0 21 kk 接着 我 们将数据进行多元线性回归 拟合出一条直线并求出任务定价的函数表达式 我们利用 SPSS 将三个变量与任务定价进行多元线性回归并进行拟合 得到新定 价规律 4 1 7 7202 01 3 8 04 2 5 3 iiii QEDW 5 9 回归结果如下表所示 表 3 2 多元线性回归显著性分析结果 平方和 自由度 平均值平方 F 显著性 sig 回归 2245 337 3 748 446 39 365 0 残差 9848 736 518 19 013 总计 12094 073 521 当显著性值 sig 小于 0 05 时 我们可以认为自变量与因变量之间存在显著 线性关系 结果显示显著性值 sig为 0 则可认定回归方程通过显著性检验 表 3 3 各系数及其显著性分析结果 1 2 3 系数值 3 425 0 138 0 02 72 417 T 8 763 2 674 2 858 232 420 显著性 0 0 008 0 004 0 结果显示 每个系数的显著性值都小于 0 05 则可认为三个变量都与任务 的定价存在显著性相关 通过显著性检验 我们得到这种原因下未完成任务点的新定价方案 15 4 1 7 7202 01 3 8 04 2 5 3 iiii QEDW 接着 我们利用新的定价方案 对这种情况下未完成的任务点进行修正定价 这里我们给出部分任务点的新定价我们称为修正预期价格 完整结果见支撑材料 表 3 4 第一种原因下的部分未完成任务修正 定价结果 任务序号 真实定 价 iP 预期价格 iW 修正预期价格 iW 5 65 5 69 2 69 3 8 65 5 68 4 68 4 9 66 0 70 5 70 8 11 65 5 66 6 64 8 12 65 5 66 1 65 0 18 66 0 70 2 70 4 23 65 5 68 9 68 9 由 结果我们可以看出任务定价都有提高 那么经过重新定价以后这些任务有 很大的可能性会被完成 5 3 2 第二种原因下未完成任务点的新定价模型的建立与求解 我们得到的第二种原因是定价不低但有效识别范围内没有会员 这些任务点 是属于周围没有会员没有被完成的类型 这种情况下需要提高定价吸引会员前来 完成 在模型建立的时候我们首先考虑从问题一得到的定价函数进行改进提高任 务定价 但是这些任务点周围是没有会员的也就是说这些任务点是不具备定价函 数的变量数据 因此这种想法被推翻 接着 我们将这种类型的任务点与周围没 有会员却被完成的类型任务点联想在一起 认为这些未完成的任务点的定价与周 围没有会员却被完成的类型任务点的定价 有关 我们建立新的模型给出第二种原因下未完成任 务的定价 我们认为这些定价 等于离它最近的已完成任务点的定价 但是这些任务点必须满足方圆 1km 没有 会员却被完成这个条件我们称为目标任务点 我们就得到这种原因下未被完成的 任务的新定价模型 16 mn m n nm d D D PW min 0 0 5 10 mW 为这种原因下第 m 个任务点的新预期定价它是未完成的 nP 为这个未 完第 n 个任务点的真实定价它是已完成的 mD 和 nD 分别是任务点 m 和 n 的供求 距离 它们都为 0 说明它们方圆 km1 以内没有会员 我们利用 MATLAB 搜索每一个 这种原因下未完成任务点附件满足模型限制条件的已完成任务点 这个已完成任 务点的 真实定价就是未完成任务点的新定价 我们利用 MATLAB 对目标任务点进 行搜索 程序代码和算法见附录二 我们得到未完成任务点的新定价 这里我们给 出部分结果 完整结果见支撑材料 部分结果见下表所示 表 3 5 第二种原因下的部分未完成任务修正 定价结果 任务序号 任务定价 iP 目标任务点序号 重新 定价 iP 1 66 0 786 80 4 75 0 786 80 25 67 5 745 75 29 66 0 786 80 30 68 0 777 85 56 73 0 777 85 58 69 0 777 85 5 3 3 第三种原因下未完成任务点的修正 定价模型建立与求解 第三种原因是任务点的定价不低但地理位置偏僻 因此我们认为应该在原先 的定价上进行位置偏僻的价格补偿 也就是在原基础上提高定价 我们在问题一 得到的函数上面加一个常数地理位置因子 C 在这个模型中我们是这样计算 C 的 C 3 nPW ii 5 11 iW 是将这种原因下未完成的任务点的数据代入 5 7 公式中求出的定价 iP 17 为任务的真实定价 地理位置因子 C 是两个定价差值的绝对值的平均数 然后我 们就能得到这种情况下的任务修正定价模型 CQEDW iiii 321 5 12 321 为回归系数 为常数 新 任务定价只是在问题一 中函数的基 础上加上一个地理位置因子 我们 计算出地理位置因子为 5 5 这样 们就可以给 出任务修正定价模型 5 5417 7202 0138 0425 3 iiii QEDW 5 13 公式可以简化为 9 1 7 7702 01 3 8 04 2 5 3 iiii QEDW 5 14 利用新的定价模型我们可以对这种原因下的未完成任务重新定价 我们计算 出结果 完整 结果见支撑材料 这里我们给出部分结果如下表所示 表 3 6 第三种原因下的部分未完成任务 修正 定价结果 任务序号 真实定价 iP 修正预期定价 iW 重新定价 iP 2 65 5 61 3 66 8 6 75 0 70 4 75 9 35 66 5 62 1 67 6 37 70 0 70 2 75 7 38 75 0 70 2 75 7 40 66 0 63 5 69 0 44 69 0 64 3 69 8 5 3 4 问题二新定价模型总结 考 虑到已完成的任务中存在由三类原因导致的不合理定价 故修正定价模型 也从这三类原因出发分别进行修正 1 第一类修正 从附件一中筛选已完成任务的相关数据仿照原始定价模型 再次进行多元线性回归拟合 从而对问题一中第一类未完成原因下的任务重新计 算其修正价格 以此作为这些任务的修正价格 2 第二类修正 对于由于所选范围内无会员分布的未完成任务的定价修正 18 采用离其最近的相同条件下的已完成项目的定价作为修正价格 3 第三类修正 对于属于第三类因地理位置影响导致未完成的任务 引入 地理位置因子对其进行修正 定义为用实际价格与用第一类修正模型下的拟合函 数所得的预期价格的差值的期望值 5 4 打包定价模型的建立与求解 5 4 1 任务装包模型 问题三要求将任务打包发布 其目的是为了防止出现因任务位置集中导致用 户争相选择的情况 将任务积累打包再同时发布 可以增大一次洗发布任务的数 量 缓解会员 供大于求 的情况 故将任务装包的关键因素为各任务之间的绝 对距离 直线距离 不考虑实际情况下的连通路程 故任务装包的基本思想 为 按任务序号升序搜索 以某一半径 r 搜索其范围 内所有其它任务 将同属同一范围的任务装入同一任务包 再进行发布 按入包 的先后顺序剔除重复任务 使每个任务包中的任务各不相同 因为原始定价 模型 中采用半径为 1 任务距离过大可能导致匹配会员时出现较大误差 故也令 1r 即判断任务是否装入同一任务包的依据为 mnd 1 5 15 其中 m n 表示任务序号 mnd 表示第 m 个任务与第 n 个任务间的绝对距离 按此方法进行任务装包的最终结果为共装 217 包 装 包 情况如表 3 1 所示 完整装包情况见支撑材料 具体算法代码见附录三 表 4 1 部分任务装包情况 任务包序号 包内任务序号 1 29 362 444 2 364 4446 3 360 4 22 23 32 462 5 52 61 68 5 4 2 任务包 整体多元线性 定价模型 19 任务装包后在某一时间发布 即包内所有任务同时发布 由于同一任务包内 任务位置集中 故采用整体法将一个任务包看作一个 大任务 故每个包有其 自己的定价 且包内所有任务价格都等于任务包的预期定价 由 修正 定价模型知 任务的预期价格四因素有关 供求距离 消偏信誉值 总配额和 地理位置 任务 打包发布时同一包内任务发布时间相同 一定程度上消除了最早预订任务时间对 定价的影响 但仍与上述四因素相关 故任务包定价参照原始定价模型进行多元 线性回归拟合 设任务包的预期价格为 iW iD 1 iE 2 iQ 3 5 16 拟 合 所 用 的任务包的实际价格 nP 采用包内各任务实际价格的平均值作近似处理 iD 为供求距离 iE 为消偏信誉值 iQ 为总任务限额 利用 SPSS 进行多元线性拟 合结果如表 3 2 表 3 3所示 表 4 2任务包定价模型 显著性分析结果 平方和 自由度 平均值平方 F 显著性 sig 回归 1138 25 3 426 336 35 368 0 残差 8867 54 214 14 235 总计 10005 79 217 表 4 3 任务包定价函数系数检验结果 1 2 3 系数值 2 689 0 115 0 04 71 568 T 8 549 2 588 2 901 197 012 显著性 0 0 012 0 008 0 我们得到任务包定价模型 iW 2 689 iD 0 115 iE 0 04 iQ 71 568 5 17 5 4 3 打包定价模型的优劣 度 检验 利用拟合出的定价函数对附件一的未完成任务进行再定价 将其与修正定价 模型中的对未完成任务的修正定价进行比较检验打包定价模型的优劣 规定若 1 05 iW iW 80 故 可认为打包定价模型的合理程度相对较高 且其不需分情况及考虑地理位置因素 故在新任务的预测中采用打包定价模型 即 5 14 将附件三数据代入得各新 21 任务预期价格 选取属于不同任务包的任务进行展示 如表 4 1所示 表 4 1 新任务部分 价格 任务序号 所属任务包 供求距离 消偏信誉值 总任务限额 预测价格 C0001 1 0 0922 10 7238 260 68 5 C0023 2 1 2859 2606 9992 4478 70 C1030 3 0 0 0 71 6 C1339 4 0 7678 26 5362 1200 72 5 C1553 5 1 0113 55 6259 2000 75 1 C1637 6 0 6752 42 9977 1500 74 3 5 5 2 价格预测模型的 最短距任务价格评价 虽然打包定价模型有一定的合理性 但其与修正定价模型还存在一定误差 加上拟合的误差 故还需进行价格预测模型的评价 对预测定价的合理性评价采 用以 最短距任务价格 确定合理范围进行评价 具体步骤如下 1 将每个新任务 m 与所有已结束项目分别计算绝对距离 记为 mnd 具体计 算方案见附录三 2 每个任务点都取其 mndmin 所对应的已结束项目的实际价格 nP 作为 该新 任务点的参考中心价格 利用 MATLAB 计算的部分结果如表 4 2 所示 具体代码 见附录四 整结果见支撑材料 表 4 2 部分新任务的参考中心价格 任务号码 最短距 已结束任务点序号 参考价格 C0001 A0442 69 C0002 A0077 65 5 C0003 A0047 67 C0004 A0077 65 5 22 C0005 A0442 69 3 参 照打包定价模型的评价方法 取 5 确定 合理定价范围 4 判断记录由价格预测函数计算得到的预测价格是否属于合理定价范围 5 计算优劣度 的值判断其是否大于 0 8 若满足则可认为模型具有一定 的合理性 部分比较结果如表 4 3所示 表 4 3 部分评价结果 任务号码 最短距 已结束任务点序号 参考价格 预测价格 是否合理 C0001 A0442 69 70 2 是 C0002 A0077 65 5 67 5 是 C0003 A0047 67 65 5 是 C0004 A0077 65 5 66 是 C0005 A0442 69 67 5 是 统计发现新任务总数为 2066 合理定价任务数为 1672 计算得优劣度 8087 020661672 总任务数合理定价任务数 大于 0 8 于是得出评价结果 打包定价 模型对新任务定价效果较好 有一定的可信度 六 模型的优缺点与改进 6 1模型的 优点 1 我们建立的任务定价模型都是从任务与会员的供求关系出发 研究影响 任务定价的因素是以影响市场供求关系为切入点 该模型与微观经济学知识紧密 联系 2 在求解供求距离与消偏信誉值时 我们引入特征值 因为 平均距离一样 但会员分布不同这样的对于任务定价有不同影响 如果供求距离单纯是一个平均 数 那么不论会员分布如何只要平均距离是一样的会员信息对任务定价的影响是 相同的 而特征值得引入可以消除这种影响 6 2模型 的缺点 1 在考虑任务定价的影响变量时 我们可能忽略了一些重要因素变量 2 在建立模型时 我们没有过多的考虑现实中的客观情况对完成任务的影 响 我们还假设了每个会员都是理性人 这对于分析实际生活情况会造成很大影 响 3 在建立回归模型时 我们只进行了线性回归和直线拟合 没有尝试更多 23 的拟合方式 6 3模型的改进 1 我们可以获得更多的数据以建立更多的变量 来使得定价模型更合 理 2 在分析会员与任务的供求关系时 可以结合行为经济学 来对会员完 成任务的行为做更多的分析 或许能够在供求关系的研究上有重大突破 3 在进行函数拟合时 可以其他更多的函数去进行拟合 七 参考文献 1 国家地震局地球物理研究所 近 震分析 M 地震出版社 1977 2 张文彤 钟云飞 数据分析与挖掘实战案例 M 北京 清华大学出版 社 2013 308 3 李治问 金娥 熊强 用户质量对平台定价策略的影响研究 A 江苏大学 2017 4 吴瑞杰 孙鹏 孙昱 分布式任务计划动态调整模型及算法 A 空军工程大学 信息与导航学院 2017 24 附录一 function credit1 xinyu a c e credit1 zeros 835 1 n 1 sum 0 k1 0 4 for i 1 835 for j 1 1877 25 if 111 199 sqrt a i 1 c j 1 a i 1 c j 1 a i 2 c j 2 a i 2 c j 2 cos a i 1 c j 1 2 cos a i 1 c j 1 2 500 credit1 i 1 credit1 i 1 5 end end xlswrite C Users 123 Desktop 信誉值 xls credit1 end function credit2 pe2 b n 1 sum 0 c xlsread C Users 123 Desktop 附件一 已结束项目任务数据 2 xls d xlsread C Users 123 Desktop 会员位置 xls e textread C Users 123 Desktop 配额 txt task2 zeros 217 1 k1 0 4 for i 1 835 for j 1 835 sum e i 1 if b j i 0 sum sum e j 1 n n 1 end end credit2 i 1 sum n k1 n 1 end xlswrite C Users 123 Desktop 总配额 xls task2 end 26 function distance jl a c distance zeros 835 1 n 1 sum 0 k1 0 6 for i 1 835 for j 1 1877 if 111 199 sqrt a i 1 c j 1 a i 1 c j 1 a i 2 c j 2 a i 2 c j 2 cos a i 1 c j 1 2 cos a i 1 c j 1 2 1 sum sum 111 199 sqrt a i 1 c j 1 a i 1 c j 1 a i 2 c j 2 a i 2 c j 2 cos a i 1 c j 1 2 cos a i 1 c j 1 2 n n 1 end end if n 1 distance i 1 sum n k1 else distance i 1 sum n 1 k1 end n 1 sum 0 end xlswrite C Users 123 Desktop 供求距离 xls distance end 附录二 function n p nobodyprice a textread C Users 123 Desktop 无人且未完成 txt b textread C Users 123 Desktop 无人且完成 txt m 1000000 n zeros 36 1 p zeros 36 1 for i 1 36 for j 1 95 if 111 199 sqrt a i 3 b j 3 a i 3 b j 3 a i 4 b j 4 a i 4 b j 4 cos a i 3 b j 3 2 cos a i 3 b j 3 2 m m 111 199 sqrt a i 3 b j 3 a i 3 b j 3 a i 4 b j 4 a i 4 b j 4 cos a i 3 b j 3 2 cos a i 3 b j 3 2 p i 1 b j 1 n i 1 b j 2 end end 27 end 附录三 function task2 pe2 b n 1 sum 0 c xlsread C Users 123 Desktop 附件一 已结束项目任务数据 2 xls d textread C Users 123 Desktop 会员位置 txt e textread C Users 123 Desktop 配额 txt task2 zeros 217 1 k1 0 4 count 0 q 1 for i 1 835 for j 1 835 if b j i 0 for m 1 1877 if 111 199 sqrt c j 1 d m 1 c j 1 d m 1 c j 2 d j 2 c j 2 d m 2 cos c j 1 d m 1 2 cos c j 1 d m 1 2 1 sum sum e m 1 n n 1 end end end end if sum 0 task2 q 1 sum q q 1 end n 1 end xlswrite C Users 123 Desktop 第三问配额 xls task2 end function distance2 jl2 b n 1 sum 0 c xlsread C Users 123 Desktop 附件一 已结束项目任务数据 2 xls d xlsread C Users 123 Desktop 会员位置 xls distance2 zeros 217 1 k1 0 6 for i 1 217 for m 1 1877 28 if 111 199 sqrt c i 1 d m 1 c i 1 d m 1 c i 2 d m 2 c i 2 d m 2 cos c i 1 d m 1 2 cos c i 1 d m 1 2 1 sum sum 111 199 sqrt c i 1 d m 1 c i 1 d m 1 c i 2 d m 2 c i 2 d m 2 cos c i 1 d m 1 2 cos c i 1 d m 1 2 n n 1 end end for j 1 835 if b j i 0 for m 1 1877 if 111 199 sqrt c i 1 d m 1 c i 1 d m 1 c i 2 d m 2 c i 2 d m 2 cos c i 1 d m 1 2 cos c i 1 d m 1 2 1 sum sum 111 199 sqrt c i 1 d m 1 c i 1 d m 1 c i 2 d m 2 c i 2 d m 2 cos c i 1 d m 1 2 cos c i 1 d m 1 2 n n 1 end end end end distance2 i 1 sum n k1 n 1 sum 0 end xlswrite C Users 123 Desktop 第三问供求距离 xls distance2 end function credit2 xinyu2 b n 1 sum 0 c xlsread C Users 123 Desktop 附件一 已结束项目任务数据 2 xls d xlsread C Users 123 Desktop 会员位置 xls e textread C Users 123 Desktop 信誉值 txt credit2 zeros 217 1 k1 1 2 q 1 count 0 p zeros 217 1 for i 1 835 for j 1 835 if b j i 0 count count 1 for m 1 1877 if 111 199 sqrt c j 1 d m 1 c j 1 d m 1 c j 2 d j 2 c j 2 d m 2 cos c j 1 d m 1 2 cos c j 1 d m 1 2 1 29 sum sum e m 1 n n 1 end end end end if sum 0 credit2 q 1 sum n k1 q q 1 end n 1 end xlswrite C Users 123 Desktop 第三问信誉值 xls credit2 end function a pro3 d a zeros 835 835 a d for i 1 835 for j 1 835 if a j i 1 else a j i 0 end end end for i 2 835 for m 1 i 1 for j i 1 835 if a j m 1 end end end end end 附录四 function p duibi p zeros 2066 2 b xlsread C Users 123 Desktop 附件一 已结束项目任务数据 2 xls a xlsread C Users 123 Desktop 附件三 新项目任务数据 xls 30 j 1 for i 1 2066 m 111 199 sqrt a i 1 b j 1 a i 1 b j 1 a i 2 b j 2 a i 2 b j 2 cos a i 1 b j 1 2 cos a i 1 b j 1 2 for j 2 835 if 111 199 sqrt a i 1 b j 1 a i 1 b j 1 a i 2 b j 2 a i 2 b j 2 cos a i 1 b j 1 2 cos a i 1 b j 1 2 m m 111 199 sqrt a i 1 b j 1 a i 1 b j 1 a i 2 b j 2 a i 2 b j 2 cos a i 1 b j 1 2 cos a i 1 b j 1 2 p i 1 j p i 2 b j 3 end end j 1 end xlswrite C Users 123 Desktop 第四问任务匹配价格 xls p end
展开阅读全文
相关资源
相关搜索

当前位置:首页 > 办公文档 > 解决方案


copyright@ 2023-2025  zhuangpeitu.com 装配图网版权所有   联系电话:18123376007

备案号:ICP2024067431-1 川公网安备51140202000466号


本站为文档C2C交易模式,即用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。装配图网仅提供信息存储空间,仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知装配图网,我们立即给予删除!