7月26日,英国《卫报》收到爆料称,苹果公司的合同工(contractors)会对语音助手Siri的部分录音进行监听和分析,以此来提高Siri的智能水平。据爆料人称:「有无数的录音记录,包括医生和病人对病情的讨论、商业交易、疑似犯罪交易、性行为……这些录音文件还标记着位置、联系方式和用户数据。」
苹果公司很快对报道作出回应称,收集的录音是Siri使用记录中非常小的随机量,通常只有几秒钟,内容也并不会对应到用户的苹果账号,并且审核员有法律义务严格遵守苹果的保密要求,对Siri的录音的分析,将适用于检测「语音助手是否被误唤」、「Siri能否提供帮助」、「Siri能否给出适当的回应」这三个Siri产品设计上的功能。
当问Siri是否一直在「听」| iOS截图
爆料人表示,录音大多取自Siri被意外唤醒的情况,其中最常见的来源设备是Apple Watch和HomePod。合同工需要向苹果提交意外唤醒的录音记录,但只需上报技术问题,无需上报录音内容。不过合同工可以自由查看大量的数据,其中就包括偶然录下用户的地址、姓名等信息。
爆料人担心这些信息可能会被滥用,他们认为苹果应该向用户坦白「人工听取和分析语音助手录音」这一岗位的存在。
数据喂养的语音助手
人们几乎默认,在语音助手越发人性化的声音背后,是纯粹的程序和算法。在用户和语音助手交流过程中,不会有任何人工的参与。这也是为什么,人们可以放心地把智能音箱放在自己的客厅和卧室里。
但近年的一些爆料和报道,揭露了「人工转录和分析」这一工作,在智能语音助手的更新迭代中无处不在,又鲜有人察觉的现象。
今年四月,据彭博社再次爆料,亚马逊有安排专门的工作人员转录并分析语音助手Alexa和用户对话的部分数据。据知情人士称,「Alexa人工转录团队」由亚马逊外包和全职亚马逊员工共同组成,团队遍布全球,但整个计划被禁止公开讨论。
波士顿的一名工作人员表示,他负责识别一些已达成部分社会共识的词语并给予标记(比如当用户提到「周杰伦」,反馈关于「音乐人周杰伦」的结果,并关联到音乐平台)。这些工作人员表示,他们曾听到过女性洗澡时哼歌、儿童在家中尖叫、疑似的性侵犯行为等或有趣,或不知所云,或令人毛骨悚然的录音片段,他们会在内部聊天室中分享和交流,但亚马逊不会就录音内容介入干预。
亚马逊发言人表示,此举只为改善用户体验,提高语音识别率和自然语言理解系统,录音内容只是Alexa一小部分随机样本,所有的信息被高度保密,并且亚马逊对分析系统的滥用行为零容忍。但在6月28日,亚马逊公共政策副总裁Brian Huseman就对民主党参议员关于Alexa的质疑,他回应称,亚马逊会无限期地保存录音和语音记录,即使用户删除了音频,亚马逊也不会删除这些记录,除非用户给亚马逊客服打电话,要求删除全部用户资料。
七月初,比利时广播公司VRT NWS同样也收到来自「人工转录团队」承包商的爆料,这次的对象是谷歌。VRT NWS收到了1000多份谷歌语音助手Google Assistant和用户之间对话的录音。在分析过后,VRT NWS表示有153条对话是在用户无意唤醒Google Assistant(即没有使用「Hey Google」等指令的情况)后录下。
随后谷歌承认了这一情况的存在,不出所料,谷歌的辩词和苹果以及亚马逊如出一辙。谷歌表示,在世界各地雇佣承包商是为了让「语音技术适用于多种语言、口音和方言」,用于分析的录音段落只占Google Assistant所有使用量的0.2%,并且不会对位到用户的谷歌账号,人工转录员也必须遵守严格的保密条约。谷歌目前已经就爆料事件进行调查。
苹果、亚马逊、谷歌和它们分别对应的Siri、Alexa、Google Assistant,无一幸免地被曝光了类似情况。三家公司的回应也非常模版化:「随机只录一小段、不会对位到用户账号、工作人员和数据高度保密、用于减少误激活以及改进语音识别技术」。较之亚马逊和谷歌,苹果作为最新曝光的公司,遭受的质疑却声量更大。
正如《卫报》所指出的那样,苹果并未将「Siri可能会录音」这一信息披露在它们给消费者看的《隐私条约》中。同时,不同于Alexa和Google Assistant把「设备录音」作为可选项,苹果用户只能选择「禁用Siri」或「开启Siri」(也就默认开启录音)。最讽刺的是,苹果正是在宣传上最强调隐私保护的科技公司。在今年初的CES展上,他们在会场外投放了一个巨型广告,宣传语是:「What happens on your iPhone, stays on your iPhone.」(在iPhone上发生的事,就让它留在iPhone上。)为了强调iPhone在隐私保护上的安全性,在今年3月,苹果公司还投放了首支主打隐私保护的广告「Private Side」。
用户认知跟不上智能音箱的销量
据市场研究机构Strategy Analytics的数据,2018年全球智能音箱出货量高达8620万台,其中第四季度单季度销量3850台,同比增长95%。智能语音助手也在这几年发展的如火如荼,语音助手日益人性化和智能,但终归会撞上技术难题的门槛。如今的问题并不是如在电影《她》中所体现的「难以分辨真假的语音助手」,在语音助手发展的初级阶段,人们需要解决的问题是「理解我的意思,给出相应的答案」。
实际上,三家公司对录音片段的需求还停留在一个非常基础的问题上———如何不误触发语音助手。比如西班牙语中de Hecho(事实上)可能会唤醒Echo,法语中avec sa(和他)可能会叫醒Alexa。在语音助手还没有精准地做到防误触的同时,智能家居却已经遍地开花。仅以Alexa举例,Alexa已经和超过20000个智能家居设备合作,声音来源有耳机、安全系统、汽车等100多种产品。
智能家居和语音助手的「隐喻」|《大西洋月刊》
不同于屏幕点触的直接交互,声音的交互更加隐蔽。从目前的情况来看,智能家居产品和语音助手进入用户生活场景的速度,或许已经超过了语音助手智能水平的成长速度,甚至,在用户还没能适应语音助手的存在时,客厅和卧室里就已经摆满了搭载着语音助手、时时刻刻连接云端的智能设备们。
语音交互与文字交互不同,口音、节奏、情绪、背景等多种数据才能造就精准的识别能力。近几年智能语音助手水平显著提高,它们的语音和发音愈加自然,对语义的理解愈发准确。近一年的连番爆料显示,语音助手的这些进步的背后,除了算法工程师以外,还有很大一部分功劳要归功于不知情的用户。
抹去了身份信息并不意味着无迹可寻,只要用户开口,信息就会产生,数据就会被收集。语音助手程序的精准和智能离不开对用户数据和信息的了解,但用户也应该有一个「您接下来和语音助手的对话可能会被录音,尽请谅解。」的知情权。
【TechWeb】12月2日消息,金山软件发布公告称,于2019年12月2日,金山云集团与某个金山云股东、高级管理人员及中国互联网投资基金(有限合伙)订立购股协议,金山云(作为发行人)同意向中国互联网投资基金投资者发行约5509万股每股票面价值 0.001美元的D+系列优先可转换股份,代价为5000万美元。假设(i)金山云的所有优先股按1:1之转换比例悉数转换为金山云普通股;及(ii)购股权计划项下的所有股份及僱员持股计划(包括信託契据)项下保留以供发行的所有股份获发行,于完成购股协议项下拟进行交易后,金山云将由中国互联网投资基金投资者拥有约1.8868%,而本公司于金山云的股权将由49.1251%减少至48.1982%。金山云将仍为本公司附属公司。董事会进一步宣佈,于购股协议完成时或之前,金山云当时的所有股东将订立经重列股东协议,据此,D+系列优先股持有人有权于以下情况下要求金山云购买彼等持有的D+系列优先股:(i)D系列合资格公开发售未于特定期限内完成;(ii)金山云的任何B系列优先股持有人已根据经重列股东协议要求金山云购买其持有的B系列优先股;(iii)金山云的任何C系列优先股持有人已根据经重列股东协议要求金山云购买其持有的C系列优先股;或(iv)金山云的任何D系列优先股持有人已根据经重列股东协议要求金山云购买其持有的D系列优先股。金山云集团主要从事云技术的研发并提供相关服务。中国互联网投资基金投资者为于中国注册成立的有限合伙,主要从事互联网领域的股权投资。就董事作出一切合理查询后所深知、尽悉及确信,中国互联网投资基金投资者及其最终实益拥有人均为独立于本公司及其关连人士的第三方。
最近一段时间,大家发现很多网站关键词库和流量都在直线下滑,站长圈可以说是哀嚎遍野。即便是一些大站权重站,有些也难逃厄运。如上图所示,图中案例就是一个之前操作过快排而被惩罚的站点。其下场不可谓不悲壮。在这里我们先了解一下快排。现在的快排,主要分为两类:模拟点击;发包技术。其中模拟点击是租用大量的服务器和ip,在服务器上搭建一个模拟浏览器并使用脚本在浏览器上模拟用户的搜索行为,来提高页面在百度的评分。发包技术是直接伪造用户搜索浏览行为参数,直接将数据包post给百度,可以快速的将页面在百度的评分提高。发包技术中不乏上千指数大词3天上首页的案例。这种快排方式严重干扰了百度搜索的市场环境,因此百度在进行了打击快排灰度测试后,开始扩大算法应用范围,其结果就是如今的大量网站的关键词库像瀑布一样直线下降。既然算法已经来了,我们也只有选择原谅,哦不,是选择面对。百度打击快排,最主要的首段就是靠抓取快排的特征。其中发包快排的特征比模拟点击特征明显很多,因此如果您还要继续做快排,对于发包快排的供应商一定要慎重又慎重的选择。那么模拟点击就不会被打击吗?也一样会被打击。做模拟点击的作弊网站,有个很大的特征就是:有大量的词的点击率超过了50%甚至接近100%。这种极其不正常的现象,让百度也有了反击的方向。因此如果还要做模拟点击,就必须降低点击率。否则依然一抓一个死。当然,我在这里并不是提倡大家做快排,既然是快排,就有被惩罚的风险,靠白帽技术安心优化,为更多的用户提供搜索价值,百度自然会将您的网站排名提升上去,自然会将搜索流量像你倾斜。快排就像一杯毒药,你喝或者不喝,都是你的选择。既然百度开始打击了,我们就必须沉着的去面对。如果可以的话,现阶段不要去碰快排这个雷区,安心做优化,做内容,做外链,为真正的搜索用户做好服务,才是最好的选择。上图那样稳定的幸福,又有谁不想要呢?
TOP