大数据是近年来非常热门的一个概念。因其热门,所以吸引了很多保险业人士的关注,普遍认为大数据将给保险业带来新的技术手段,有利于更精准地挖掘客户需求、产品定价和营销、风险防范以及业务决策。但笔者认为,大数据很有可能给保险业在风险管理领域带来前所未有的挑战,保险业一定要预作准备。
大数据分析的是数据,但数据不等于事实。
大数据分析数据间的相关关系重于因果关系,而对事实的分析研究必须建立在因果关系基础上。
大数据应用的一个典型例子就是谷歌利用人们在网上的搜索记录来预测流感爆发的趋势。根据维克托·迈尔-舍恩伯格在《大数据时代》这本书中所写,谷歌在2008年统计人们搜索流感关键字的频率,将其与2003年以来的搜索结果均值做对比,准确预测了2009年流感的爆发,准确率高达97%。但这本书没有讲2010年和2011年的预测准确率。实际上,这两年的准确率都大幅走低,其中2010年的预测结果显著低于实际结果,2011年的则显著高于实际结果。
根据2014年3月美国《科学》杂志一篇文章的研究结论,谷歌预测失灵的原因就在于只注重研究数据间的相关性,而忽视了数据间的因果关系。流感关键字的搜索频率同流感爆发之间可能有相关关系,但未必是因果关系。比如某部同流感有关的电影正在热映,某个已故名人是因流感去世的,恰逢他的忌年或生年,这些都可能增加对流感关键字的搜索,但同流感爆发没有因果关系。此外,“预期的自我实现”也是一个原因。“预期的自我实现”在股票市场上体现得最典型。人们预期某支股票股价会上涨,于是纷纷买入,股价随之上涨,人们发现股价真的上涨了,更加坚定信心,大量买入,股价上涨得更为猛烈,预期就这样自我实现了,而股价上涨的信息源头可能只是一则小道消息,与价值重估或业绩好转根本无关。在流感预测上也类似,开始时预测流感有爆发迹象,各种媒体大量转载,人们也纷纷转发各种预防常识,结果流感关键字搜索频率大幅上升,于是预测值也大幅上升,意味着流感可能即将大爆发,最后才发现不过是一场小型流感;如果开始时预测流感不太可能爆发,各方面放松了对流感的警惕,疫苗准备不足,人们也疏于防范,结果一场小型流感反倒大流行起来,因为临时生产疫苗已经来不及了。
实际上,只关注数据间的相关关系,而忽视因果关系,在统计学上被称为“数据挖掘误区”,是早已被批驳过的错误做法。
大数据可能在人们无意识时有效,当人们有意识地使用大数据时,大数据的预测就不准了,这可称为大数据的“测不准原理”。
“测不准原理”是物理学中的一个概念,指测量粒子位置,必然会影响粒子的速度;而测量粒子速度,又必然影响粒子的位置。
这个道理同样适用于大数据结果的运用。比如根据交通流量预测,某条高速公路可能即将发生拥堵,司机知道这个情况后,选择走另外一条路,但当很多司机做出这一选择时,堵车的道路可能恰恰是原本预测不堵车的路,原本预测发生拥堵的高速路反倒没有拥堵。这一问题固然可以通过提高交通流量预测频率的办法解决,但对于那些被堵在路上的司机而言,已经是于事无补了。
再举个例子。根据健康大数据预测某人患某病的概率很高时,可能会对该人收取很高的保险费乃至拒保,但该人知道这一情况后,加强运动、注意饮食、愉悦心情,结果在很大程度上延缓了病症发作,大数据的预测失真了。
当大数据分析成为一门技术时,人们可以很容易地算出风险发生概率,那时只有高风险的人才会买保险。
随着健康管理技术的不断进步,未来人们可以很容易地利用随身设备监测各项身体数据,并整理成可分析的大数据。利用这些数据可以算出自身患病的概率,将患病概率同对应的纯风险损失率作对比,如果低于纯风险损失率,就选择风险自留,不投保;如果高于,就选择投保,把风险转移给保险公司。但当大部分投保人的出险概率都超过计算保费时的纯风险损失率时,保险公司必然是亏损的。
上面讲的不是天方夜谭。目前健康监测技术已经发展到可嵌入人体牙床、血管、内脏的可嵌入设备,乃至根本不用嵌入任何设备的超声波诊断技术。至于如何计算患病概率,不排除以后出现分病种的患病概率计算器,就像现在网上的等额本息还款计算器、提前还款计算器一样,客户只需按要求输入数据,概率自动求出。甚至健康管理设备可以直接算出患病概率,显示给客户。
20年前,胶片相机流行的年代,修理照片还是一门技术活,要由专业人员操作才行。而现在呢,手机拍照,美图秀秀、魔漫相机等各种修图软件争先恐后降低技术门槛,力争让人上手就会。修饰照片已经成为一项普遍技能。20年后,人人都可能成为自身健康的精算师,小病走社保,常见大病先自测,高风险的投保,低风险的自留,残留风险走大病补充,特殊疾病以社交关系为纽带走互助,而保险公司承保的大部分是高风险业务,亏损将成为必然。这一场景不是没有可能。
在其他风险管理领域也可能出现类似情况。2012年8月30日的《纽约时报》报道了一家创新公司,叫气候公司。据当时报道,这家公司计划购买亚马逊提供的气象云服务,在美国全境采集100万个地点的实时气象数据,为客户提供临时、短期和中期的气象预报服务,并可结合客户所在地的土壤、水质等情况,为客户提供气候风险报告。客户根据报告,可以选择是否在保险公司投保农业气候保险。可以想见,只有当客户的气候风险大于计算保费时的纯风险损失率时,客户才会购买气候保险。这一模式如果推广开,美国的农业保险公司恐怕只能承保病虫害和龙卷风、雹灾等突发性气象灾害保险了,洪涝、旱灾等常规性农险责任,要么客户不投保,要么投保的就都是高风险业务。
无独有偶,2014年5月27日,中国气象局公共气象服务中心与阿里云达成合作,海量气象数据将通过阿里云计算平台,变成可实时分析应用的“活数据”。计划深度挖掘利用的数据包括:建国以来的历史气象数据;全国2万多个观测站、卫星、雷达监测的气象观测数据,包括降水、温度、风力风向、地面结冰、太阳辐射、酸雨、空气能见度等30余项;短期、中期、长期的气象预报数据;通过国际交换获取的全球气象观测、预报数据。阿里云计划将气象数据嵌入阿里来往、支付宝、高德地图等产品,多渠道传播气象等灾害预警信息,同时为服装、饮料、空调、旅游等领域客户提供季节性生产、经营建议等,计划涵盖饮料销量、羽绒服销量、空气净化器销量、洗车、太阳能发电、居民用电量、农产品(000061,股吧)生产、灾害、航班延误、工程工期预测等。
大数据只关注数据,忽略了人性。
具体到保险业,最大的人性就是逆选择的道德风险。目前热门的大数据加可穿戴设备的技术路线恰恰蕴藏了很大的道德风险。
大数据应用有一个典型例子,就是百度、阿里巴巴等平台根据客户的搜索记录,主动向客户推荐相关产品,促进客户购买。这一推荐服务有利于满足客户需求,因此是客户需要的,客户愿意真实地向平台暴露自身的搜索情况,为的是换取更精准的商品推荐。另一个典型例子是以阿里小贷、京东金融为代表的基于网络交易数据发放的网商信用贷款。阿里小贷中,阿里巴巴是根据商户最近6个月的实际成交额并结合物流数据进行审核确定的,涉及出口时,还要关联海关数据,同时商户在阿里平台交易,还需要交纳一定数额的保证金或购买履约保险。总之,无论哪种情况,第一客户有主动的需求,从而在主观上避免了提供虚假数据的情况,第二平台有较为完善的风险控制手段,在客观上能够防范信用风险。
但大数据在保险业的应用是相反的。高风险客户很清楚保险公司对自己了解得越准确,对自己收取的保费就会越高,因此他有足够的动力不向保险公司展示真实情况,而可穿戴设备正好提供了这样一个工具。保险公司无法掌握到底谁在佩戴设备,采集的数据到底是不是被保险人的,即使指纹开启也无法确保开启后是被保险人在佩戴。如果要求被保险人每隔一段时间就用指纹再确认一次的话,客户体验又不好,特别是监测睡眠时怎么办?
解决问题的一个思路是使用可嵌入设备,在投保时把设备直接嵌入被保险人体内。但在保险业竞争激烈的情况下,客户会同意嵌入设备吗?又有哪家公司敢于冒着丢失客户的风险这样尝试呢?因此,大多数公司必然还是会选择更易为客户接受的可穿戴设备。
另一个思路就是保险公司不提供设备,而是从第三方健康管理公司购买客户的健康数据,以减少客户的逆选择风险。但是中立的第三方健康管理平台的数据就一定真实吗?我在朋友圈里晒我每天坚持走路10公里,就真的能够证明我走了吗?有无可能是我的虚荣心在作怪呢?此外,第三方健康管理平台有权向保险公司出售或提供客户私人的健康数据吗?如果经过客户授权,那么客户就知道数据会被用于保费厘定,则依然存在逆选择风险;如果没有经过客户授权,就可能涉嫌泄露客户隐私。即使这些问题都能够得到解决,也就是第三方健康管理平台可以合法合规地提供高质量的客户健康数据,可以断言,此时该平台必然会要求保险公司付费取得客户数据,对该平台数据的争夺又会沦为一场比拼费用的竞赛,就如同现在各家保险公司对淘宝入口和银行渠道的争夺一样,保险公司还是翻不了身,永远在给别人打工。
第三个思路是保险公司搭建移动健康管理平台,邀请健康程序开发商接入平台为客户提供服务,使用程序的客户经某种方式转化为保险公司的客户,保险公司则在承保时参考客户在平台留下的数据。此思路在美国已经落地,但效果并不好。美国寿险公司安泰在2012年上线了两个移动健康管理平台——健康参与者和健康通行证,但在今年宣布将陆续关闭这两个平台。原因在于,平台虽已吸引20余家健康程序开发商接入,但始终无法导入足够的终端用户。没有终端用户,后续承保工作就无法开展,保留平台就只能是在烧钱。
一切从实际出发,坚持独立思考,避免人云亦云。
现在新技术、新概念层出不穷、日新月异。保险业一定要稳住心神,千万不要盲目跟风。既要解放思想,对新事物持欢迎态度、积极研究,更要实事求是,始终记住保险业的实力弱、底子薄,一步也失误不得;始终记住保险经营的是风险,面对的是人性,人性中也有丑恶的一面;始终记住商业保险不是慈善事业,盈利是可持续经营的前提,对那些“羊毛出在猪身上”的互联网免费模式,一定要想清楚了再干。
积极研究大数据,建立自己的标准和技术门槛。
移动互联网和云服务时代的大数据应用已经成为必然趋势。面对这一形势,保险业无视、躲避甚至畏惧大数据都是不可能的。保险业应当主动作为,利用自己的资金优势和数据积累,在大数据领域提前布局、占位,建立自己的标准和技术门槛,有意识地引导大数据应用朝着有利于自己的方向发展。
目前,大数据应用还处于摸索试验阶段,主流应用不过集中在精准广告推送、客户需求分析上,还没有深入到风险识别、健康管理等领域。保险业一定要有危机意识,尽快确立在大数据应用上的技术壁垒(如专利),尽快成为游戏规则的制定者,甚至还可以考虑直接并购相关的大数据应用研发公司。唯有如此,挑战才不会演化成危险。
笔者在这里想引用阿里巴巴创始人马云的一句话。马云讲,“阿里不是一家拓展技术边界的高科技公司,而是一个利用技术进步拓展商业边界的公司。阿里的商业模式不是商业帝国,而是商业生态圈”。阿里尚有此雄心,坐拥9万亿资产、号称从业人员近400万的保险业难道没有吗?难道一定要坐等被别人颠覆吗?
保险公司由被动的风险接受方向主动的风险管理方转型。
美国波士顿大学通过对美国产业革命的历史数据分析发现,产业变革通常发生在两个领域:一是旧产业的核心业务;二是旧产业的核心资产,主要指知识、品牌、专利等无形资产。产业变革的路径又可分为四种:一是核心业务和核心资产都因变革而被淘汰,比如数码相机取代胶片相机,不但胶片相机本身消失了,而且柯达、富士等胶片生产巨头也消失匿迹了;二是核心业务和核心资产随着技术进步也在渐进式变革,同新技术融为一体或各有侧重地发展,比如拍卖行既有传统的线下拍卖,侧重高价值、非标准化的拍品,也有线上拍卖,侧重价值不高、标准化的拍品;三是核心资产受到冲击,但核心业务仍然保留,比如激光打印机虽已得到大规模应用,但传统的针式打印机仍然在海关、税务等领域的多联打印场景下广泛使用,只是不再有知名品牌存在了;四是核心业务受到冲击,但核心品牌仍然保留,比如面对京东等线上平台电商的冲击,苏宁、国美等传统线下家电大卖场的销量明显下滑,但品牌仍是耳熟能详,具有很高的价值。
基于上述理论,保险业面对大数据挑战的最优应对路径自然是核心业务和核心资产都得以保留,并渐进式变革,同新技术融为一体。由此,保险业一个可能的转型路径就是由被动的风险接受方向主动的风险管理方转型,保费则转变为风险管理费。
以健康险为例,一个可能的办法是由卖健康保险产品向提供健康管理服务转型。未来,客户每年向健康管理公司(保险公司)缴纳一笔年费,享受一年的健康管理服务(具体内容还需要在实践中摸索),如果在一年中出现健康问题,由公司负责安排治疗并承担费用,如果全年健康,则公司赚取利润。
气候保险领域也是如此。农场主向气象风险管理公司缴纳一笔年费,享受一年的气象预警服务,如果一年中出现预警以外的突发性气象灾害或超过预警值的气象灾害时,风险管理公司因为履约失误,向农场主赔偿损失,如果一年中出现的气象灾害都在规定时间内被公司进行了预警,则公司充分履约,无须向农场主赔偿。
实际上,上述转型思路在国际保险界已经开始显露苗头。澳大利亚人伤理赔管理界已经提出,应把人伤理赔管理视为健康和生产力的推动者,而不是传统的履行赔付义务、降低赔付成本的部门。他们认为,理赔管理的目的是确保受伤个体及其生产力得到最大程度的恢复,而保险公司则应为实现上述目的提供合理、充足和必要的服务。
在新技术条件下,要继承和发扬传统的风险防范手段。
大数据的优势和固有的缺陷,决定了保险业既要善于使用大数据,但又不能迷信大数据。如何协调两者?一个可能的办法就是继承和发扬保险业几百年积累下来的风险防范的经验做法,比如核保体检、免赔额、无法找到第三方时强制免赔等。正如电脑可以替代笔和纸,但永远无法取代笔和纸,因为电力供应可能中断、电脑硬盘可能坏掉、电子信息可能泄露,有时笔和纸可能是最保险的。用户至上、体验为王这些互联网时代的口号,固然有道理,但保险业仍需对其保有一分警惕,千万不能脱离行业实际。