孟生旺：广义线性模型—发展与应用.ppt

资源描述

第十二届中国精算年会The12thChinaActuarialAnnualConference 广义线性模型发展与应用孟生旺中国人民大学统计学院Email mengshw 主要内容基本的广义线性模型理论与应用模型评价费率约束广义线性模型的推广与应用分布假设的推广GAM与GAMLSS GAMforLocation ScaleandShape 神经网络与回归树应用案例 2 基本GLM 理论与应用分布假设正态泊松负二项索赔频率伽马逆高斯索赔强度Tweedie 纯保费二项续保率连接函数恒等加法模型对数乘法模型预测值大于零logit 预测值在 0 1 区间 3 Tweedie 泊松和伽马的比较 Tweedie 泊松 p 1伽马 p 2 4 模型评价1 偏差近似服从自由度为n p的卡方分布除泊松外效果不是很好对于嵌套模型偏差之差近似服从p q的卡方分布近似效果较好注 SAS中称fD为偏差称D为尺度偏差 5 模型评价2 残差下页图示 Anscobe残差 Deviance残差若分布假设是合理的标准化处理后近似服从标准正态分布若偏差di的绝对值大于1 说明对这个观察值的拟合效果较差 6 7 模型评价3 Type1和Type3分析 8 模型评价4 标准误置信区间和p值 9 模型评价5 把样本数据分为三组数据充足训练样本 trainingdata 测试样本 testdata 评价样本 validationdata 模型评价6 Box Cox检验 10 来源 Andersonetc 2007 Practitioners guidetoGLM 11 模型比较信息准则AIC或BIC的值越小越好误差平方和的比较 12 GLM的优缺点优点统计检验处理相关性和交互作用见下页现成软件缺点无法处理加法和乘法的混合模型参数模型函数形式有限寻找交互项耗时 13 费率约束 A区域的费率系数不超过1 20B区域的费率系数保持在当前水平1 10不变如何解决传统方法方法2 抵消项方法3 一般约束条件下的广义线性模型 14 费率约束的处理费率约束的处理抵消项例区域A和B的费率系数分别限定为1 2和1 1 区域C和D不受约束另一个费率因子为性别假设不存在其他费率因子 15 权重与抵消项的关系泊松回归为例因变量索赔次数 C 权重无抵消项 log 风险单位数因变量索赔频率 F 权重风险单位数 e 抵消项无 16 费率约束情况下何时不宜使用抵消项例公司希望开拓高端住宅保险市场措施之一是适当降低其费率问题保额与区域高度相关应用抵消项的结果区域因子会调整使得高端住宅的费率仍然较高解决途径方法3 一般约束条件下的广义线性模型 17 18 方法3 一般线性约束下的费率厘定约束条件参数估计 GLM的推广与应用分布假设的推广过离散混合泊松分布泊松逆高斯泊松对数正态零膨胀零膨胀模型长尾对数正态帕累托0 1之间取值的变量 Beta分布 19 广义可加模型 GeneralizedAdditiveModels GAM GAMLSS模型 GAMforLocation ScaleandShape 20 神经网络模型 21 神经网络模型的优点广义线性模型的推广非线性无需事先指定解释变量与因变量之间的函数关系可以以任意精度逼近任意的连续函数预测效果通常要优于常用的广义线性模型但有例外 22 神经网络的缺陷缺乏进行统计推断和模型检验的统计理论模型参数不易解释预测过程类似于一个黑箱有可能会引入不必要的交互项导致过拟合 23 回归树优点无需对因变量和解释变量之间的函数关系作出假设可以方便地处理交互作用缺点拟合值是分段常数不大可能产生很好的拟合效果 24 最小偏差法及其推广下页优点建立加法和乘法的混合模型缺点没有严格的统计检验 25 26 应用案例来源 Ismailetal 2007 和Cheongetal 2008 马来西亚车险汇总数据 27 28 广义线性模型的参数估计值 29 广义线性模型的拟合结果比较 30 回归树的结果 31 模型的误差平方和比较 32 费率约束约束下述三个类别的预测值落在 0 01 0 03 33 对选定的三个风险类别约束前后的索赔频率预测值约束索赔频率的拟合值要落在区间 0 01 0 03 内 34 对所有风险类别约束前后的索赔频率预测值约束索赔频率的拟合值不超过0 05 小结预测精度神经网络模型方便性实用性可解释性泊松回归伽马回归Tweedie回归Logistic回归 Beta回归 35 谢谢 36

展开阅读全文

孟生旺：广义线性模型—发展与应用.ppt

最新文档