新闻  |   论坛  |   博客  |   在线研讨会
特斯拉庞大的数据宝库
传感器技术 | 2023-01-17 08:55:52    阅读:403   发布文章

特斯拉汽车确实收集了海量信息。在佛罗里达州发生的事故很好地说明了这一点。2014年两名年轻人驾驶特斯拉Model S电动汽车发生车祸并起火,导致两人丧生,特斯拉因此面临过失诉讼,驾驶人父亲因电动车电池易燃而起诉特斯拉。在辩护过程中,特斯拉提交了一份历史速度分析报告,报告表明,早在事故发生前几个月,这辆车就经常以危险的速度行驶。这些信息已被特斯拉汽车悄悄收集并上传至服务器。

尽管没有证据表明特斯拉收集的数据超出了客户与该公司在服务条款中约定的范围,但外界尚不清楚特斯拉汽车具体收集了哪些数据,又会如何利用这些信息。因此,事关如何访问并利用这些数据时,我们不得不思考占主导地位的是是车主还是该公司。即使不是特斯拉车主,这些问题也与我们息息相关。每辆新车都装有多个传感器,通常包括摄像头和雷达,用于收集驾驶员和周边环境的数据。如今,汽车数据行业已实现全球互联,人们匿名交易车辆、驾驶员和位置等数据,这些数据是全球各大汽车设备制造商利用数千万辆汽车经过几十亿次车程汇总所得来的。但是,这些车辆似乎没有像特斯拉一样定期、大量或长期地存储数据并将其发送给制造商。荷兰法医研究所的一名研究员弗朗西斯•胡根迪克(Francis Hoogendijk)说:“据我们所知,特斯拉汽车收集的数据最多。”这名研究员在2016年美国和荷兰相继发生致命车祸后开始调查特斯拉的数据系统。尽管仍有许多细节尚不清楚,但在美国国家运输安全委员会(NTSB)事故调查、美国国家公路交通安全管理局(NHTSA)报告以及特斯拉文件的帮助下,我们可以了解到特斯拉汽车收集的数据以及该公司会如何利用它们。接下来是已知情况的简要说明。
首先,特斯拉汽车配有事故数据记录仪(EDR),大多数新车都配有这种设备。这些“黑匣子”记录仪会收集事故发生前5秒左右的信息,包括车速、加速情况、制动使用、方向盘操作以及自动制动和稳定性控制系统的操作等,以便协助调查事故。特斯拉汽车媒体控制单元(MCU)的“信息娱乐”计算机中的4GB或8GB内存卡可永久存储这些数据以及更多数据。这些带有时间戳的“网关日志”文件还包括安全带使用情况和汽车自动驾驶系统的各项参数信息(包括驾驶员是否有把手放在方向盘上)。由于网关日志使用车辆标准控制器局域网(CAN)总线的数据,因此可能包含唯一的车辆识别码。但没有证据表明这些日志包含来自车辆GPS模块或摄像头的信息。例如,特斯拉车主将车辆连接Wi-Fi进行远程更新以添加新功能或修复漏洞时,网关日志会定期被上传到特斯拉服务器。从佛罗里达州的诉讼案来看,特斯拉肯定有办法根据这些数据找到原始车辆。(对于澄清这一问题或其他事项的要求,特斯拉没有做出回应。)不过,这些网关日志文件只是冰山一角。特斯拉的自动驾驶(Autopilot)计算机可利用车载摄像头捕获的数据来实现巡航控制、车道保持和撞车警报等驾驶辅助功能。如果车主将U盘插在车上,行车记录仪可以实时记录并设置哨兵模式(Sentry Mode),以便在停车期间记录车辆周围的环境,但这些记录似乎没有上传至特斯拉服务器。不过在某些情况下,特斯拉汽车确实会存储图像且2016年及以后的车型还会存储视频并与该公司共享。有一位工程师兼特斯拉车主曾利用抢救后的车辆和零部件研究过特斯拉的数据收集过程,他表示,这些Autopilot“快照”可以记录数分钟的内容,并包含多达数百兆数据。这位工程师使用网名Green(@greentheonly)在推特上发布了他的发现。胡根迪克指出,这些快照还包括高分辨率日志数据,类似于网关日志中捕获的数据,但其采样率高得多,轮速信息高达每秒50次。当车辆发生碰撞或满足某些条件时,就会触发数据快照,其中可能包括特定的驾驶行为或Autopilot系统检测到的特定对象或情况等特斯拉工程师想要了解的任何内容。图片
Green表示,系统通常会在发生车祸时收集GPS位置数据,有时快照中也会体现这些数据。虽然车祸触发的快照也会尝试使用车载4G蜂窝网络完成上传,但是汽车连接Wi-Fi后,快照和网关日志数据一样,会被上传至特斯拉服务器。Green表示,一旦快照成功上传,Autopilot计算机的机载32GB内存卡就会将其删除。Green说除快照外,2017年年中或之后推出的特斯拉车型每次从驻车挡切换行驶挡时,Autopilot计算机还会完整地记录行程日志。行程日志包括行驶路径、车速、道路类型以及是否启动Autopilot系统和何时启动等一系列GPS坐标信息。Green表示,无论是否使用Autopilot系统(或车载全自动驾驶模式),行程日志都会被记录下来。和快照一样,行程日志上传至特斯拉服务器后就会从车载电脑中删除。

图片


这个数据宝库有什么作用?特斯拉已在全球售出约300万辆汽车,其中大部分每天都会联系总部。这些汽车为特斯拉提供了数十亿公里的真实驾驶数据和GPS轨迹记录,以及数百万份照片和视频。那么这家引领全球电动汽车制造业的公司会如何处理这些信息呢?虽然特斯拉没有具体说明,但也不难推测。
2019年,埃隆•马斯克在一次专门讨论自动驾驶的特斯拉活动日上说:“实际上,人们每时每刻都在训练网络。”当时他介绍了特斯拉的一系列半自动辅助驾驶技术,统称Autopilot,这是如今装配应用最广、也最具争议的驾驶辅助系统。虽然它得到了许多司机的喜爱,但这项技术牵涉数百起车祸,其中不乏一些致命事故。目前,美国国家公路交通安全管理局正对此项技术展开全面调查。大多数自动驾驶技术研发公司都依赖于一支高度仪表化的测试车队,这些车都配备了高分辨率摄像头、雷达和激光测距仪。据估计,其中一些车辆每秒可产生750MB传感器数据,为神经网络和其他机器学习系统提供了海量训练数据,用于改善其驾驶功能。密歇根大学公私合营交通研究机构Mcity的负责人亨利•刘(Henry Liu)表示,目前这类系统可以在各种天气状况和道路条件下有效完成日常驾驶作业。图片
“但如今,就安全性能而言,自动驾驶比人工驾驶差一两个等级。”亨利·刘说,“因为目前的自动驾驶汽车遇到的偶发事件,也就是低频、长尾、关键性安全事件不够多,不了解如何应对此类事件,因此无法摆脱‘遇罕见事就宕机’的情况。”特斯拉的做法非常大胆,其客户提供的数据足以将自动驾驶汽车的安全性能提升至超人类水平。由于被告知如果自愿参与技术开发,那么在不久的将来就可以享受自动驾驶的乐趣,所以许多人很乐意这样做。在过去几年的演讲中,马斯克和特斯拉的前人工智能负责人安德烈•卡佩西(Andrej Karpathy)详细介绍了该公司的自动驾驶技术,包括影子模式(Shadow Mode)。在这种模式下,车载Autopilot计算机不是在控制汽车,而是模拟人类驾驶员的驾驶过程。当它的预测结果与驾驶员的行为不匹配时,Autopilot计算机可能会触发记录数据快照,以便稍后上传到特斯拉服务器。图片
随后,特斯拉工程师可以使用这些结果来更好地训练其用于自动驾驶的神经网络。或者他们可能会通过这些快照了解到自动驾驶系统出现的故障,比如无法正确识别被树木遮挡的路标等。在这种情况下,工程师可以开发检测器一类的特殊软件,并将其下载安装到某些特斯拉汽车上。此类检测软件认为自己发现路标时,就会读取车载摄像头捕获的画面,以便稍后上传。特斯拉工程师很快就会收到数千张图片,他们会使用这些图片来训练检测软件,其最终目的是在所有量产车辆上使用这一软件。“我不确定在没有试验车队的情况下要如何构建这样的数据集。”卡佩西说。
亨利•刘非常看好特斯拉利用其日益增长的消费群体的做法。“我认为一支小车队是无法处理这些罕见事件的。”他说,“但是如果部署数百万辆这样的车队车辆,那将是庞大的数据收集工作。即使有这些影子驾驶员,由于没有真正可用的公开资料,我也无法了解特斯拉是否做到物尽其用。”成本也是一个障碍。卡佩西承认,雇用大型团队评估并标记图像和视频的成本很高。他说,特斯拉正在研究可以根据Autopilot快照中捕获的视频片段开展自主训练的检测器。2022年6月,特斯拉解雇了195名数据标记员,如此看来,特斯拉现在肯定具备了这项实力。虽然特斯拉车队学习自动驾驶颇具前景且有许多客户的热情支持,但特斯拉尚未证明Autopilot和人工驾驶一样安全,更遑论让人们信任无人监管的车辆驾驶了。此外,还有其他困难迫在眉睫。今年7月中旬,卡佩西从特斯拉离职,特斯拉仍然有可能被美国国家公路交通安全管理局下令召回其配备Autopilot的汽车。尽管这是对特斯拉的一次沉重打击,但却无法让特斯拉停下收集客户数据的脚步,更无法阻止Autopilot汽车继续销往美国之外。特斯拉使用车队数据开发Autopilot的举措与脸谱网、谷歌和推特等互联网巨头在用户推动下的崛起有着异曲同工之妙。按照马斯克的说法,客户驾驶得越多,自动驾驶系统的表现就越好。不过,正如其他科技公司因挖掘客户数据而面临审查一样,特斯拉也开始遭到强烈反对。人们开始想要了解车辆收集的所有信息,以及当政府等其他机构想要获得这些信息时又会发生什么。图片
对于2017年年中之后生产的特斯拉汽车,网名GREEN的工程师表示:“每次出行,它都会全程记录行驶轨迹、GPS坐标等其他数据。”Green还说,在上传至特斯拉服务器时,这些行程日志和Autopilot系统捕获的数据快照会抹去车辆识别码,并随机分配一个临时ID号。他指出,临时ID号可使用数天或数周,并且关联到了此期间的所有上传内容。“隐私的未来”论坛(Future of Privacy Forum)政策高级副总裁约翰•威尔第(John Verdi)表示,鉴于某些行程日志还可能记录驾驶员来往于家、学校和工作地点的行程,因此期望其匿名化是不现实的。他说:“如果某个机构正在收集、保留并分享个人历史位置数据,那么要实现去识别化是非常困难的,这几乎是不可能的。”特斯拉和其他汽车制造商一样,都制定了政策,明确规定了可以用从客户车辆获得的数据(包括位置信息)来做什么和不能做什么。政策规定,虽然公司不出售客户和车辆数据,但可以依法与服务提供商、商业合作伙伴、附属机构、一些经授权的第三方和政府部门共享数据。虽然车主可以花1400美元购买一个特殊套件,用于查看在自己车上安装的行车记录仪上的数据,但这种与事故相关的信息仅是特斯拉所收集内容的一小部分。由于美国加州和欧洲的法律要求特斯拉提供数据访问权限,所以当地车主可查看自己车辆产生的数据,但不包括在名义上属于匿名信息的Autopilot快照和行程日志。一旦政府发现某个公司拥有巨大的信息宝库,那么它获得这个宝库可能只是时间问题。南卡罗来纳大学法律和工程学院的副教授布莱恩特•沃克•史密斯(Bryant Walker Smith)说:“如果数据……归非数据主体的某方所有,那么政府很有可能以某种方式获得这些数据。”史密斯说这不一定就是坏事,并且认为如此庞大的数据可以用于判断哪些道路或十字路口是危险的。丰富的数据也可能揭示车辆本身的微小问题。威尔第表示,在许多方面,恶果已经造成。“人们应该像看待手机一样看待其车辆。”他说,“汽车行业可以从手机操作系统处理数据权限的方式中学到很多东西……近年来,针对数据的收集、披露和使用,iOS和Android在赋予消费者权利方面取得了长足的进步。”特斯拉允许车主管理部分数据的共享情况,其中包括Autopilot和路段分析。如果车主想彻底停止收集数据,则可以要求特斯拉完全禁用车辆的连接功能。但这就意味着无法使用远程服务、网络广播、语音命令和网络浏览等功能,甚至无法在线更新相关安全软件。Green说,他还没见过有人能成功作出这种重磅决定。他说,“去维修点,让他们把调制解调器从车上拆下来”是终止数据共享的唯一方法。几乎可以肯定的是,在众多汽车制造商中,特斯拉拥有最大体量的客户和车辆数据。虽然特斯拉占据了联网汽车议题的半壁江山,但其他公司也不甘落后。迎接其他电子设备已经适应的数据驱动型世界,埃隆•马斯克的这一见解正在迅速成为行业标准。当汽车变得和手机一样智能时,它们会在监控、隐私和问责方面面临同样的挑战也就不足为奇了。

作者:Mark Harris 

来源:悦智网


*博客内容为网友个人发布,仅代表博主个人观点,如有侵权请联系工作人员删除。

参与讨论
登录后参与讨论
推荐文章
最近访客