国光电器电子报

2019年8月31星期六
2019年第16期(总第696期)

国光电器经营管理 持续创新改善  提高生产效率 工会补贴圆你大学梦! 国光电子举办消防演练 智能音箱,你在窃听我吗?

按日期检索

12 2017
3
4

国光电器

电子报刊阅读器
放大 缩小 默认

智能音箱,你在窃听我吗?

□ 作者 段贤旺

关于智能音箱的偷听、存储、泄密和人工监听,哪些是真相?哪些是谣传?

正在“监听”的音箱

自2014年,亚马逊推出Echo智能音箱后,通过赋予音箱人工智能属性,受到市场青睐。至此,智能音箱成为科技巨头标配智能硬件,纷纷推出搭载自家语音助手的智能音箱,借此争夺用户家庭场景入口,也开启了语音控制家庭时代。在这一场争夺战中,亚马逊、谷歌、百度、阿里、小米与苹果占据全球智能音箱85%市场份额,牢牢控制了全球市场格局。

“夫妻吵架智能音箱报警”的新闻让许多网民都震惊了,智能音箱竟然还有如此操作。美国警局的声明中证实,是谷歌智能音箱Home Hub打通了911,但谷歌官方却矢口否认,并表示自家的音箱并不具备报警功能,这就很尴尬了……类似的情况最早发生在亚马逊Echo身上,亚马逊给出的回复是“误操作”,意思是,在运行时,Echo设备将一段对话的内容误解为指令的,以为用户希望将此前的语音内容发送给通讯录中的某个人,随即执行了这一指令。

同样,网传一些国内的智能音箱用户反馈,家中摆放的智能音箱多次突然汇报“设备正在进行系统升级,已更新**个应用”,“虽说很正常的内容,但家里没其他人,音箱突然说话,每次都吓我一跳。”甚至有一次,在她邀请朋友到家中做客,彼此相谈甚欢时,智能音箱突然被唤醒了,并毫无预兆地为众人播放了一首林俊杰的《杀手》。“带屏”音箱则带来了影像方面的疑虑,随着“窃听事故”增多,有用户怀疑,自家的带屏音箱有“回家看看”的功能,既然可以远程直播家里正在进行的情景,是否也会同时将这些影像记录下来,传输至其它地方?

人们对智能音箱这款产品的疑惑越来越多。从“它在监听我吗”延伸至:它休眠时会收声吗?收声之后,是否会存储和传输这些对话?这些声音真的会被人听到吗?以及,它会被黑客攻击,变成一个“窃听器”吗?

谣传与真相

智能音箱的识别工作分为“本地”和“云端”两种情况,在智能音箱处于未唤醒状态时,为本地工作状态,虽然会收录外界声音,但不会对这些声音进行存储与语义识别。“唤醒前相当于在做声波识别的工作”智能音箱将收录的声音与唤醒词做对比,声波相符时,才会自动打开”。目前市场主流的多款国产智能音箱无一存在主观故意监听的情况。如果真的要做到故意监听的话,这是将是一件成本很高的事情,有音箱专家这样算了一笔账:假设一家企业累计售出100万台音箱,活跃量20万,如果企业要启动这些音箱做24小时监听,就算每秒钟产生100k数据,乘以20万的话,累计起来传输带宽、存储和计算的花费相当惊人。更关键的是,在当前的技术处理能力下,企业尚不能将这些庞大而又碎片化的录音转化为有商业价值的有效信息。就算不考虑道德层面,只看商业利益,企业也没有动机去做主观的信息收集。在去年的一项由国家工信部主导的智能音箱检测工作中,在未唤醒状态下,各家智能音箱传输的数据量均仅为KB级别,对于语音资料而言,这一数据量几乎可以忽略不计。

与“窃听”传言较为相符的内容是“唤醒词”之后的智能音箱工作模式。音箱被唤醒后,将进入云端工作状态,将收取的声音传输至云端服务器,完成语音语义识别和反馈工作。“这是无法避免的”,目前智能音箱内置的运算能力,无法支撑AI类的语音语义计算,更无法在本地实现识别能力的提升。

按照智能音箱的产品策略,当用户结束命令,如数秒内无新声音出现,机器则会恢复休眠状态(每家品牌设定不太一样,有的是3秒内、有的是5秒内)。然而,在实际工作中,由于智能音箱整体成熟度有限,“唤醒”和“休眠”均有可能出现误差。“例如刚好有声音和唤醒词相似,或者命令结束后有其他声响,使智能音箱以为需要继续工作,它就会持续拾音,而用户对此是不知道的。”众多用户遭遇的所谓“窃听事件”,均源于这类原因。

一般来情况下,目前智能音箱行业内较理想的“误唤醒率”约为每48小时2次,更糟糕的情况则达到每24小时2-3次,这无疑意味着误操作下较高的所谓“窃听”频率。对各品牌AI语音平台来说,当下最关键的都是提高AI能力,减少误操作,收集来的语料是最好的训练素材。为了优化语音数据、提升指令响应的准确性,国际、国内主流语音平台中,均有“人工审听”环节。为尽量保护用户隐私,录音在被人工听取前会进行数据脱敏、打散,尽管员工会听到录音对话,甚至涉及私密事务,但并不能识别用户的具体身份。在云端过程中,音频文件本身不会跟用户账号信息、设备信息相对应。智能音箱所录取的语料也不会被永久存储,在完成识别后,音频文件会被删除。 随着AI模型识别能力的提高,采用人工审听的比例或将会有所降低。对于各音箱硬件生产厂家来说,重点是控制好麦克风阵列拾音部分的声学质量(灵敏度、失真度、频响度等指标)以及音箱扬声器谐振对麦克风的影响。

无疑,智能音箱和其它语音助手类产品,尚且不是一个成熟品类。这使得此类产品存在诸多漏洞,例如误唤醒。再例如“黑客攻击”,去年8月,在美国拉斯维加斯举行的全球黑客大会Defcon大会上,腾讯安全团队仅用26秒便成功破解了亚马逊的Echo,远程控制指定设备,使该设备在未唤醒、不提示的静默状态下自动录音,并将录音文件通过网络发送给远程服务器。“当2300台音箱中,有1台智能音箱被物理攻击,其他的智能音箱都可以通过局域网内的非接触式攻击被黑客置入后门,成为黑客的远程窃听器”。在破解时间后不久,腾讯安全专家伍惠宇在一场演讲中表示。当然,在腾讯将这些漏洞提交后,亚马逊已经完成了这部分的修复和更新。

就在今年8月23日,据美国科技媒体CNET报道称,微软的承包商利用Cortana语音控制功能监听Xbox用户。同时称,在2016年引入Cortana之前,来自Kinect系统的语音命令中的语音数据也在被收集监听之列。微软上周透露,人类可能会收听从微软语音服务(包括Skype和虚拟助手Cortana)的语音对话中截取的“片段”(新浪科技)。

看来,智能音箱作为语音信息采集的一个入口,在信息传输、处理、储存的每个阶段都有可能被人为窃取,在物联网、AI时代,我们是没有隐私、无所遁形的,即便没有智能音箱,通过手机和电脑或其他联网的影像设备,每个人的信息、喜好、习惯等种种信息,早已被各社会组织所掌握,本质上,这并无不同。除非在计算能力更为强大的未来,全部智能产品均在本地运算,全部断网,只有偶尔更新系统时联网,但这对普通人而言,这种高技术难度、低商业价值的设想过于遥远,也过于不切实际。

面对这些焦虑,一些人选择了远离智能音箱,或将家中智能音箱彻底断电,亦不再有购买其它智能家居的计划。其实在技术探测隐私的边缘,我们底线是“不形成危害”。将智能音箱置于客厅和门厅,这样,即使一些语音资料被泄露,也不会对自己与家人形成实质危害,智能音箱的收声范围大约是3到6米,很难隔墙收集,卧室基本听不到,实在有私密话题的时候,也可以拔掉电源再讲。建议带摄像头的音箱,或者其它带摄像头的产品不要放置在卧室,一旦泄露影像,将是难以挽回的重大危害:不止一位从业者透露,联网的带摄像头之类的设备,的确会将影像回传至服务器,虽然这些资料会被严格保密,但仍存在理论上的外泄风险。你无法隐藏自己,所以,只能采用最基本的方法来保护自己。

不过,有些人也抱有更乐观的态度,“智能音箱正处于野蛮生长的初级阶段,扩展到整个智能家居,都会经历这些初级阶段,这时的隐私保护,只能依赖于企业自律,”我们坚信,“当这些产品彻底普及之后,一定会有更高级别的隐私规范出现,统一行业、限制权限,并作为强制标准来执行。”

放大 缩小 默认
国光电器股份有限公司主办 国光电器手机版
制作单位:《国光电器》编辑部