如题,此处所说的语音助手指的是天猫精灵、siri 以及国产智能手机的类 siri 的功能和程序,此外新能源车上也出现了这些程序和产品。众所周知他们是靠关键字唤醒的,原理我不太清楚,但是应该是会有一个服务在后台一直监听人的说话并匹配命中关键字吧,那么如果是始终在监听的话,那么捕捉下的音频内容会不会被识别并上传呢?上传以后会不会并用来做别的用途呢?注意这是两个问题,我知道有端智能这种东西,但我不是相关从业者所以无法确定,而且各家的做法可能也不尽相同。

如果你是程序员,如果上传这些数据能卖钱,你会怎么做

我床头放天猫精灵,睡前手机外放听王爱国油管,几年了貌似还好

如果有证据表明天猫精灵会转换所有语音成文本上报,我就把它扔了

大厂应该不至于,主要是可能会被黑,现在很多智能硬件的安全性都不大高。。。

不会一直监听并处理,应该是命中关键词之后再对后续进行处理,抓包可以查吧

看注册时候的隐私政策就行了,大部分都会上传分析

会的,还会被上传标注

如果上傳這些資料能賣錢,資本家會這樣設計.設計喚醒音關鍵字「想買」,用一個服務在後台一直監聽人的說話並匹配命中關鍵字. (「天貓精靈」「小愛同學」 距離春節還有多久) -> (老婆我和你說,我「想買」小米 SU7) 喚醒音「想買」,喚醒手機,記錄「想買」之後的數個音,上傳這幾個音的流量不到幾 KB ,例如「小米 SU7 」,然後就推送小米 SU7 廣告給你. 賣一台米 SU7 要 20 萬人民幣呢.

你说它 100%有或者没有我觉得都不可能,多少应该都有。个人想法。

15 年人工智能正火热的时候,听说一小时语音包 4000 块

骑那种山地自行车,就抱怨了几句这个坐垫太小,屁股疼,晚上打开 jd ,首页有推荐加宽坐垫的广告,没有在手机任何地方有输入过相关内容。

上传和泄漏是两个步骤,可以看作是两件事,也可以看作是一件事的前因后果上传是几乎肯定的,就算不用做分析,也会用于适应你的语气和说话的情感泄漏,就看是主观故意还是无心之失了,不过无论哪种,前者都是不会承认的

把设备晾在那一天,看看语音助手耗多少电、用多少流量,不就心中有数了嘛。。

从合规的角度说,上传数据的要求远比下载数据严格。所以如果是我的话,我会设计成:从服务器预先下载全部热门产品分类的广告资源(少量图片和大量链接),并设置相应分类的唤醒词,一旦命中这些唤醒词就从预下载的本地资源中显示相应的广告;如果用户往下翻动,那么按链接列表继续从服务器加载图片等资源;如果用户点进去看,那么从服务器更新该类别更多相关推荐。

之前看有的输入法都会把你所有输入的东西上传,不知道有没有人抓包验证一下语音助手

我床头放了小爱 我是懒得关了 做坏事的时候都开着

应该没有小厂在做这个? 不要买小厂的.大厂的东西, 应该不至于官方开后门监听你, 成本+风险-->收益 划不来. 不过会不会中间被里应外合串通倒卖, 只有天知道, 只能说可能性较小但是有一个可能, 就是你被有关部门盯上, 然后他们想监听你, 这种肯定是能的, 而且大厂会毫不犹豫的配合

应该不会,这个如果有的话,弄个代理,分析一下很容易被发现。

个人认为这个是目前最合理的猜测。包括手机监听对话精准推送谈论内容相关广告

高通手机芯片的关键词唤醒从 Snapdragon 835 开始就提供硬件级的支持,后面越来越强大: www.qualcomm.com/products/features/voice-assist835 的语音唤醒功能待机状态功耗极低:Low power voice activation: 0.65 mA到了 855 ,除了支持简单地唤醒,Hexagon 引擎还有更厉害的功能:Hexagon Voice Assistant accelerator supports two wake words simultaneously (Google Assistant, Amazon Alexa, Baidu, Cortana)Aqstic offers a hardware-based voice assistant accelerator for always-on echo cancellation and noise suppression, plus up to 4 mic far-field mic support for better voice recognition in tough conditions此外配合 Secure Processing Unit 还能实现 Biometric Authentication (Voice),用于声音解锁,声纹识别甚至可以用于支付

上面的 feature 全部是在手机本地硬件实现的,不需要软件和网络的参与,如果配合操作系统和应用程序,实现更复杂的功能轻而易举,所以你说监听可不可能,我觉得不是可不可能的问题,是泄漏信息多和少的问题,泄漏给了多少个相关方的问题。建议联系下面这篇文章来看: www.secrss.com/articles/54476

只要技术上可行,就当它会。

识别是肯定的,上传的话也是有可能的

昨天参加活动和别人坐着闲聊,友 B 问友 C 来上海有没有去迪士尼玩,C 说没有来及的,马上就得坐飞机回北京。友 B 顺着话茬就说他一直想去环球影城但是没有机会。友 C 就说他就住在环球影城附近,Balabalabala…晚上我回浙江的时候微信就给我推送环球影城的广告了🙄🙄🙄反正是蛮“凑巧”的。

语音都是小事, 输入法收集的更多, 微信聊完 京东酒推荐

想想你说句小爱同学,马上就有回应,我在,这就是关键词监听,你说个其它的词比如吹风机,马上把这词加入你手机广告 id 的画像词,下次有相关广告商投广告,自动识别投送

输入法更可怕,收集的更多

目前还没有实锤,也没有一个精准的实验,大家都是靠猜测脑补

“如果你是程序员,如果上传这些数据能卖钱,你会怎么做”——给这灵魂拷问啥呢,你想说如果你是程序员你就会把用户卖了?我没误解你吧?

那得看是哪家的语音助手了,siri 肯定绝对一定不会,国产那可就不好说了。

有利润,就百分百会

我感觉 siri 应该不会,但是其实很多时候你语音讲过的东西,很可能文字也输入过给别人在昨天刚跟朋友说过在职研究生这个事,B 站就有类似的推荐,然后我仔细翻了下,原来我在微信聊天里也输入过此内容,真的很恶心现在。各大软件都像个监控软件了

唤醒是本地的,唤醒之后的内容才会上传

为啥有人会觉得 siri 不会的呢?凌镜门事件忘了吗?默认情况可能不会,但是专门部门想监听你,你看苹果帮不帮忙

本地分析,做成表后上传,又不是直接上传原始音频文件

这就和,杀毒软件不敢在游戏时弹窗,高德地图不接入超速系统一样,谁还敢用啊

抛开隐私问题,智能音箱是真的挺方便的。那么问题来了,有没有什么开源的解决方案?

会收集,会上传,但是又怎么样呢??

你是真大胆,我手机用 lineageos ,车里听 youtube 时都把手机的麦克风直接关闭的,所有应用包括电话都不能用,来电话时会提醒开启麦克风

兄弟你这也太谨慎了……这么说吧,做同样动作的人多了去了,自己在家里听完全没触犯任何法律法规。语音助手要是这么干,早就被会抓包的兄弟们发现了。之前那个 tv 版 app 偷用户上传带宽的事情就是这样被发现的。

在卡巴斯基爆出 PDD 后门之前,你所说的会抓包的兄弟没有给出任何有建设性的意见供网友参考.

什么阿猫阿狗做个网站都强制手机号登录,个人信息可值钱了。不然东南亚那几个集团军是怎么养活的。

语音助手是手机开发厂商内置的,他完全可以先加密存在本地伺机混淆在其他请求中发出去。这也不难做到。

它不需要全存到服务器,只需要获取他想要的部分上传。退一步讲,语音助手将其转为文字再上传,几乎是不费成本的,然后通过你的唯一身份不停的塑造你的“个人画像”。这个词你应该听过吧。

你直接看流量不就好了,如果持续监听,那上行应该是一直占用,而且流量也很大。

是的。你没误解我。不然为什么语音服务要免费提供呢。