【猎云网(微信号:ilieyun)】8月2日报道(编译:圈圈)
最近,多家媒体称,如Alexa和Siri等语音助手的公司员工会审听其用户录音。也就是说,我们被语音助手监听了!
四月,彭博社发表了一篇报道,其标题是“亚马逊员工正在通过Alexa监听你”。而且,比利时广播公司VRT NWS也刊登了一篇题为“谷歌员工每时每刻都在监听你”的文章。
Alex Hern在最新一期的《卫报》上称“苹果承包商会经常去听Siri的录音”。
虽然这些文章所提到的问题涉及到了人们非常在意的数据隐私,但语音助手承包商保留录音这一做法还是挺常见的,因为这些录音仅会被用于改进语音助手的功能而已。
苹果、谷歌和亚马逊等科技公司确实保留了一些录音来进行品质控制。这些录音有两种类型,其一是用户有意与语音助手交谈的内容,其二是语音助手在无意中记录的内容。第一种是指用户在说出诸如“嘿,Siri”之类的唤醒短语之后,语音助手便会开始录音。第二种是指当语音助手错误地认为它听到了唤醒短语之后,无意中记录下了用户的相关语音信息(有时确实会发生这种情况)。但无论如何,公司研究的录音都与用户的身份信息无关。
少于1%
科技公司会使用录音(第一种)来衡量和提高语音助手理解用户话语的能力,以确保其提供的答案具有适当性和帮助性。苹果表示,为了达到这个目的,他们每天只会使用不到1%的Siri录音,并且大多数录音都只有几秒钟的时长。
彭博社、NVT NWS和《卫报》上的故事并不是在质疑语音助手质量保证的必要性,而是对员工审查录音这一事件感到惊讶。
“谷歌并没有在其用户条款和条件中提到谷歌员工可以听取这些录音,”VRT NWS对此非常担心,《卫报》也说道:“苹果公司并没有明确表明这项工作会由人来完成。”
这些公司的员工审查部分录音样本不应该是一件令人震惊的事。这就像很多公司的营销计划或用户帐户数据一样,公司只是采用了一种方法来锁定数据而已。而且如果这些员工泄露或滥用此类数据,他们是会被解雇甚至是被起诉的。
而且如果不是由人类来完成这项工作的话,又会有谁来完成呢?猴子还是机器人?这项工作是为了对Siri的回答进行评价,如果苹果已经拥有可以完成这项工作的AI,它为什么不直接将其安装至Siri中呢?
听错话的Siri
《卫报》的“线人”表示,语音助手无意中录下的才刚好是人们最私密和最敏感的隐私。
有时候,你会听出来是一个医生和病人在谈论病人的病史。或者说你可以在汽车引擎的噪音中听出某人的声音。甚至,你可能会听出这是一场毒品交易。
该线人称,Siri会在听到拉拉链的声音后启动。这样,Siri就会很容易地在一些敏感的对话开始之前无意地被启动了。
但这些无意的录音也有一个重要的作用。例如,苹果会使用这些录音来了解Siri会把哪些单词或声音误认为是其唤醒短语。也就是说,这些无意的录音可以被用来改进Siri以减少Siri被误起的情况。
该线人还表示,苹果承包商确实是在鼓励工作人员将无意录音作为一个技术问题进行上报。谷歌表示,其语音助手被误启的概率约为0.02%。如果语音助手经常被误启的话,似乎收集唤醒短语听力错误样本就更加重要了。
该线人表示,尽管无意录音与有意录音都是匿名的,但仍会担心有人会在录音和用户帐户之间建立联系。“如果确实有人有邪恶的意图,那么想要找出录音中的人到底是谁就不是个难题了。“
很难理解那些有所企图的员工冒着失去工作的危险并不嫌麻烦地去在录音中找出这个人的名字是为了什么?去勒索这个人吗?或许这是有可能发生的,但似乎有点牵强。
《卫报》的线人似乎也对苹果让合同工而不是苹果内部的员工来进行对Siri的品质控制感到困惑。加利福尼亚大学圣克鲁兹分校的研究人员估计,2018年,有3.9万人与圣马特奥县和圣克拉拉县(苹果、Facebook、谷歌和许多其他硅谷公司所在地)的科技公司签订合同。而且也刚好在去年,谷歌聘用的承包商员工数目首次超过了全职员工的数目。承包商的员工将从事产品设计、销售到内容审核等各种工作。
苹果表示,其审核员必须在安全的设施中分析Siri的互动情况,并有义务遵守苹果严格的保密要求。
承包商认为,苹果应该向用户告知存在这样的人监听,尤其应该改变Siri的一些具有轻微欺骗性的回应。例如,当你问它“你会一直听我说话吗?”时,它会回答“不,我只会在你唤醒我时才会听你说话。”
承包商说,这个回答的设定显然是错误的。他们认为这样的回答也太不把误启情况的发生当一回事了。
Siri的反应应该是:“我只会在当我认为你在跟我说话时启动(或者是当我在试图学习和利用你最私密的秘密时)。”《卫报》指出,虽然Alexa和谷歌的语音助理允许用户选择退出录音,但Siri的用户只能选择完全停止使用Siri。苹果在其Siri QA流程中根本没有意识到对用户隐私威胁的问题。
语境就是一切
当Alexa、Siri和其他语音助手监听人们的事情被曝光后,人们便对在使用数字助理时的隐私问题产生了恐慌。这些数字助理代表的是一种尚未被充分理解的新型AI技术。例如,公众仍然普遍认为,语音助手使用的麦克风总是处于启动状态的。当然,这一想法是错误的。语音助手使用的音频软件背后有着多个级别的唤醒条件,并且在未启用状态下,他们只会听到唤醒词或短语后才会启动。
这些焦虑源于对科技巨头的不信任。由于像Facebook这样的公司都有着不负责任的行为,我们不再认为这些公司将认真管理我们的数据。苹果已经在其硬件和服务中构建了真正的隐私功能,但它仍在这个问题上大肆发声,似乎邀请一些人将该公司描绘成该问题的伪君子。这也就是引起人们恐慌的部分原因。
媒体要求大型科技公司对隐私问题负责。但媒体这样随意的将这一问题抛出,只会让消费者们更加担惊受怕。