评驾科技吕定海:驾驶行为数据将真正影响保险产品的设计和定价

摘要:评驾科技首席精算师吕定海解读车联网数据采集规范标准。

2018年5月14日,中国保险信息技术管理有限责任公司在北京举办了中国保信车联网数据保险应用研究成果发布会,评驾科技作为标准组组长单位出席会议,并对车联网数据采集规范的主要内容进行了介绍和分析。2.1

以下为评驾科技首席精算师吕定海发言实录:2.2

理论上来说,随着行驶里程的提高,按车年为基准的出险率应该提高,图中整体上确实体现出了这种现象。仔细观察这条曲线,发现呈现一种加速上升的趋势,理论上这种上升的速度应该是越来越慢的,用数学的语言来说,这条曲线应该是一个上凸函数,而不是下凸函数。为什么我们测算的时候会得到这样一条与理论结果不相符的曲线呢?这可能是由于本次测算数据相对而言具有一定的选择性所导致的。

 

首先,规范将数据分为四个部分:

  1. 用户特征数据组。用户特征数据组主要是为了确定是谁开什么车通过什么设备产生了驾驶行为数据,用于标记数据的归属问题。
  2. 连续采集数据组。该数据主要详细定义了,在开车过程中到底采集哪些数据以及采样频率。连续采集数据组主要由卫星定位数据、加速度传感器数据、CAN线数据组成。
  3. 车联网事件数据组。对于行车过程中产生的不平稳且具有一定风险性的事件,比如急转弯、急变道等,规范里面进行了详细描述,也希望后续规范实施的过程中各数据供应商能够按照这些定义方式来界定这些事件。
  4. 行程概览信息组。对于保险公司而言,有可能他们并不关心原始数据的采集方式,而只关心通过原始数据抽象出来的特征和关键信息,因此规范里面也进行了一些规范,帮助保险公司高效利用数据。

 

其次,为了解决数据质量的问题,规范里面还提出了数据治理的若干规则,简单来说,就是为了保证数据质量和规避可能存在的欺诈行为。

  1. 行程编号

在用户特征数据组中,并没有要求对每个行程都有一个编号,因为根据标准组的经验,很多数据实际的形式就是一串时间序列点,并没有对那些点组成一个完整的行程进行处理。从更大的角度来看,“行程”本身就是一个很模糊的概念,很难进行统一、客观地定义,为此规范里面并没有要求行程编号必须有。这种处理方式也留下一个问题,也就是在今后的建模测算中,需要采用一定的方式方法进行原始数据行程化处理,并在提取与行程有关的特征时要格外注意。,

  1. 卫星定位数据组

规范中规定的卫星定位数据都是常见的维度,比如经度、纬度、速度、定位水平精度、可见卫星数等,但是根据我们的经验,确实有些数据项,很多数据供应商不一定采集,我们也是希望借此规范去引导大家存储这些数据。这次规范里面涉及的反映卫星定位数据质量的信息,比如卫星定位水平精度、当期使用卫星数等,都是为了在提升数据质量,有效治理数据而采集的。对于大家经常说的,卫星定位数据的更新频率问题,本次规范并没有采用统一的的频率要求,主要是考虑到前装设备和后装设备等各个方面的差异性,在特定的情况下,每15秒采集一组卫星定位数据也是可以接受的。

  1. 加速度传感器数据组

加速度传感器主要用来感知各个方向力的变化,数据产生的频率可以非常高,也同时带有很多噪声。为了整体上反映汽车在行驶过程中各个方向力的变化情况,标准组对于一秒内传感器的震动情况,设计了系列指标来反映整体的情况,同时对于基础数据的产生频率要求不低于20赫兹,并按照1秒的时间窗口计算各指标。

  1. 车辆总线数据

根据前装设备的数据情况以及实际风险评估的需求,标准组在综合各主机厂的意见下,对于此类数据也进行了明确,并从实际情况规定了数据频率要求。

  1. 紧急事件传感器连续数据组

当发生紧急事件时,我们希望能够保留事件前后一段时间窗口内的加速度传感器的原始数据,用于事后还原当时的实际情况。根据标准组的测算情况,整体的数据量是可控的,并不会显著增加数据传输成本和存储成本。

 

再次,下面讨论几个更加技术的问题,希望可以对理解规范起到一定的作用。

  1. 里程计算。对于风险评估而言,车辆真实的行驶里程是一个很重要的量,那么如何计算行驶里程呢?从标准组的经验来看,有多种方法计算行驶里程:
  • 基于速度与时间乘积的里程计算方法。,其中和分别为采样点的速度和时间间隔,此处的数据主要来源又分为卫星定位速度和总线内读取的车辆行驶速度两种。
  • 基于卫星定位数据的累加里程计算方法。,其中为相邻卫星定位数据通过地球弧长公式算出的距离片段。
  • 卫星定位数据匹配道路路网信息后得到的行驶里程。
  • 直接取自车辆总线读取的行驶里程信息。

考虑目前存在的多种错综复杂的情况,规范里面并没有规定里程的计算方法,从保险公司的角度来看,只要计算的结果是准确、可靠的就可以。

  1. 急加速、减速事件判断

大家经常提到的急加速、急减速、急转弯事件,如何通过数据来判断此类事件是一个较为复杂的技术问题。目前存在以下几种方法来判断:

  • 基于1赫兹的卫星定位数据,根据速度的变化情况进行判断;
  • 采用加速度传感器的数据,首先剥离重力的影响,再采用一个旋转矩阵将设备坐标系下的力分解到车辆坐标系,并据此判断事件。2.3
  • 基于车辆总线数据,如节气门开度、油门踏板位置等数据检测此类事件。
  • 综合使用上述三种方法的融合类方法。

标准组考虑到目前各相关方具体的、工程层面上的实现方法不同,并且有些方法还属于公司商业机密,因此标准组只在规范中建议了事件检出的门限值为3m/s2,而没有对具体的检测方法做出硬性规定,但是后续标准组可能会考虑给出建议性的计算方法。

  1. 智能手机采集驾驶行为数据面临的挑战

对于智能手机采集数据,存在一系列复杂的算法和策略问题需要解决。

  • 如何决定车主已经进入交通工具内。由于能耗的问题,不能一直开启卫星定位装置,而要采用算法通过智能手机判断用户已经进入交通工具内,这个问题是比较复杂的技术问题。评驾科技作为标准组组长单位,在公司内部也一直致力于提高自动采集数据的准确率和精度,目前能做到95%的情况下,确保启动位置离真实位置不超过500米。当然,业务部门始终认为我们还能提高上述性能指标。从风险评估的角度来看,我个人认为已经足够,因为我们是通过较长一段时间的观测数据来评估驾驶行为的风险,所以对于这种小的误差是可以接受的。
  • 如何判断智能手机主人的交通模式。交通工具包括私家车、公交车、地铁、自行车等,如何通过算法来判断用户处于何种交通工具内也是一个重要的技术难点。如果有地图全量的矢量数据,可以得到一个效果不错的交通模式分类器,并将用户的行程区分为不同交通模式。
  • 驾驶员乘客识别问题。如何通过智能手机,判断其主人是否处于驾车状态是一个世界性的难题。大部分号称能解决这个问题的公司,其算法的准确率可能跟抛硬币差不多。这个问题能不能彻底解决呢,从我个人的观点来看,是可以的,但是这种方法需要手机过高的数据采集授权,容易暴露用户隐私。
  • 能耗的问题。当通过智能手机采集数据时,必须要考虑能耗的问题,也就是说所有的算法和策略必须在一定的能耗约束条件下开展。
  1. 如何推动驾驶行为数据在保险行业的应用

我们分析国外的UBI产品发展的路径,发现会从下面几个方面来分析:

  • 碳排放的减少。由于里程是一个很重要的因素,因此很多产品设计成跟里程直接挂钩。这种产品形态会提供一种内在的机制,促使行驶里程下降,这样整体的碳排放就会减少,有助于国家实现碳排放的目标。
  • 能源消耗下降。UBI产品会降低石油的消耗,对于国家能源安全、环境改善具有积极的作用。
  • 社会公平的问题。由于在发达国家,汽车基本可以算是生活必需品,而低收入群体往往属于用车较少的群体,UBI在某些方面可以降低其保费支出,改善其收入情况,有助于社会公平。
  • 道路交通事故发生率下降。UBI会提供一种机制,促使道路交通事故发生率的下降。
  • 对保险行业的影响。UBI对整个市场规模,保险行业发展等方面的影响也会被探讨,但似乎并不属于最终要的位置。

 

所以我们发现,UBI这件事情,本身具有很大的正外部性。从经济学的角度来看,具有正外部性的事情,一般不适合企业来推动,而更加需要行业性的机构来推动,因此中国保信这样的机构是可以承担更多的行业责任和使命,推动驾驶行为数据真正影响到保险产品的设计与定价,乃至解决更为宽泛的社会治理问题。

谢谢大家!

发表评论

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen:

图片 表情