注意!新能源汽车实时运行数据不佳影响可不小
对于大数据的挖掘和应用在各个层面上展开,尤其是在新能源领域。大数据作为一种基础性与战略性资源得到了广泛认可,面对“四化”未来,大数据是汽车产业发展的重要支撑。而数据质量是决定大数据分析的重要因素。
8月21日,新能源汽车国家大数据联盟在2018年中会议暨新能源汽车评价指数研讨会上发布了《新能源汽车国家监管平台车辆数据质量分析报告》。报告显示,2018年1-6月,全国接入车辆969107辆,其中627461辆车出现过错误,占比64.75%,共出现72类的错误数据,集中出现在车辆状态和单体电压/温度值等方面。总体来看,接入平台的车辆出现错误概率较大。
北京理工大学副教授、新能源汽车国家大数据联盟副秘书长刘鹏表示,错误的数据将影响数据分析结果,也会影响到企业的新能源汽车车辆里程核查。
◆成功接入平台的车辆运行数据质量仍堪忧
新能源汽车国家监管平台今年2月初正式投入使用,接入车辆已突破百万辆,用于新能源汽车安全监管、数据分析、车辆管理和补贴核算等工作。截至2018年8月13日,接入整车服务平台的车辆数为104.76万辆,注册整车企业429家,通过“平台符合性检测”的整车企业384家,通过“车辆符合性检测”的车型5388个。
企业平台若想接入国家平台,需要经过车辆静态数据接入和动态数据接入审核。目前此平台共存储有效数据231TB,每天新增约1TB数据。其中实时数据人工审核通过车辆为76.6万辆,占比73.18%;实时数据未审核与未通过的车辆数为28.1万辆,占比26.82%。审核未通过车辆多为不符合GB/T 32960的要求。
尽管车辆通过了相关审核成功地接入国家平台,但是在实际运行中仍出现多项错误。报告显示:车企出现错误数据的车辆数占该车企总车辆数的百分比大于50%的占比超过83.5%。这个数字实在不容乐观。
◆前8类错误类型多由车载信息采集模块精度低传输差造成
按照国标GB/T 32960-2016的要求,新能源汽车国家监管平台实时信息采集项为61项,包括驱动电机、车辆位置、整车、极值数据、报警数据、故障下的单体数据等。
排在前8位的错误类型中,出错率最高的项目是“车辆状态为空或错误”,占比16.76%;排在第四位的错误类别是充电状态为空或者无效,占比4.82%。造成这种现象的原因可能是某些型号车辆的充电状态检测装置损坏所造成。
除了以上两类错误,其他排名在前的6类错误均为电池单体问题,包括单体温度和电压的错误,初步判断为车载信息采集模块精度较低,传输数据质量较差。从丢包率大于1、30秒内里程跳变大于2公里等错误车辆占比来看,说明车载数据采集装置的精度和传输速率都有待改进。
◆车企数据质量参差不齐 可能影响补贴核算
在报告中,不同企业的数据质量相差很大。有的企业接入平台车辆的出错率达到100%。企业车辆数据出错率在50%以上的占企业总数比重为70.4%,仅有小部分车企的数据治疗较好。新能源汽车国家大数据联盟同期发布了“新能源汽车大数据指数TOP-n车型”,这些车型的数据良好
来看一个实例,A企业,接入平台车辆总数为29631辆,车辆数据出错率为94.4%,单车错误数量均值为2883条。具体出错数据项有电池单体电压最高值与实际包内单体电压值不相等、混动模式发动机无数据、车速大于0而车辆状态为熄火、里程为空或无效等等。刘鹏分析,“这家企业出现的动力电池相关数据项错误比重已超过71.7%。动力电池作为新能源汽车的关键部件,它的优劣直接影响着整车性能,电池数据质量过差会直接影响新能源汽车的安全。”
另外,刘鹏提醒企业注意,像这家企业‘里程为空或无效’错误项占比接近5%,出现此项表明该企业车辆实际运行里程与上报里程存在一定偏差,会直接影响该车企的里程核查。
近几年,像长安汽车、上海汽车等整车企业在多方位挖掘大数据的价值,用于产品改进、研发、销售和服务等领域。像宁德时代等电池企业,他们认为大数据的价值在于通过故障监控、预警体系确保车辆安全可控,通过监控体系降低维修成本,提高运营效率。
分析新能源汽车平台现存的72类数据差错,除去传感器、数据采集装置、电池等硬件因素外,企业平台数据对接国家平台在实时传输中数据产生的冲突和不一致,也导致大数据质量问题。
不管怎样,大数据价值挖掘的基础在于数据,数据质量优劣直接影响大数据分析结果的可信度。如何保证数据符合标准,并保证完整、准确、稳定和一致,将成为车辆大数据分析的重要课题。