蘋果外包爆料:你手機里的Siri,聽到了嘿嘿嘿的聲音
毒品交易、醫療病史、甚至不可描述,Siri錄下的聲音都被人聽到了
郭一璞 發自 西四環
量子位 報道 | 公眾號 QbitAI
你跟Siri的對話,不光會被錄下來,還會被外包公司監聽分析。
這就是今日曝出的蘋果隱私大新聞。
據《衛報》得到的蘋果外包公司員工爆料,這些包含Siri被誤喚醒時的內容,都將被一一記錄分析。
錄下來的內容包括病人和醫生私下溝通的病情、商業機密、毒品等非法交易,甚至可能還有和愛人“嘿嘿嘿”的錄音。
而且,這些錄音除了聲音之外,還附帶了用戶數據,包括錄音發生的位置、聯系方式和app應用數據,這些用戶數據本來是用來驗證你對Siri下的命令有沒有被成功執行的。
雖然各種蘋果設備里可能都有Siri,但最容易被竊聽的是智能音箱HomePod,以及Apple Watch,畢竟手表容易被誤觸。
隨身攜帶的電子設備,可能記下你說的話、所處的地理位置,以及各種app使用記錄,那恐怕對于蘋果公司而言,你已經沒有什么秘密了。
外包們聽到了你的小秘密
收集到之后,這些數據就會被蘋果發送到全球各地的外包公司,外包公司靠這些錄音來評估Siri的服務質量。
因此,外包公司的人類員工們可以聽到各種蘋果用戶的隱私。
“你肯定能聽到醫生和病人討論病史,有時候你還能聽到在汽車引擎的轟鳴聲里有人似乎在討論毒品交易,甚至你還會聽到有人嘿嘿嘿的時候剛好就被錄了音。”爆料的外包公司員工這樣說。
當然,傳到外包公司的數據里,有一些是用戶的正常喚醒,有一些是Siri意外被喚醒。外包公司的領導們讓聽錄音的員工把意外喚醒報告出來,但只是當成一個bug來匯報。如果員工聽到類似犯罪、個人隱私等敏感的聲音,他們是沒有流程來處理這些數據的。
“我們一直被催著干活,盡快完成這些工作,唯一需要匯報的內容是你在哪里聽出了技術問題,完全不需要匯報錄音內容本身記錄了什么。”
聽別人的隱私信息,對外包公司員工來說也是十分尷尬的事情。
更嚴重的是,爆料的員工意識到,外包公司沒有什么像樣的審核制度,所有人都能輕輕松松接觸到大量的數據。而且,想要分辨出錄音中的說話人并不是一件困難的事,尤其是Siri意外被喚醒的時候,說話人的地址、名字這些信息都能拿到。
一旦這些外包公司中有人心懷不軌,查明錄音主角后,借此作惡并非難事。
蘋果誠實嗎?
那么,蘋果這種把包含誤喚醒的錄音拿給外包真人聽的行為,到底合不合規范?
如果詢問Siri:“你是不是一直在聽?”Siri會回答:“我只在你跟我說話的時候聽。”忽視了意外喚醒的可能。
在隱私文檔中,蘋果明確說了Siri的數據與用戶使用其他蘋果應用的數據無關,不會連接到其他應用數據上去,也不會和Apple ID聯系起來。
并且Siri的官方網站也說明,Siri會在本地進行離線學習,個人信息也不會被買個廣告商等組織,“而端到端隱私加密,確保了他人無法獲取你設備之間同步的信息,就連 Apple 也不例外。”
重點來了,蘋果的隱私網站上也寫著:
在獲得你明確同意的前提下,Apple 可通過分析你的 iCloud 使用情況和從你賬戶收集的數據,進一步改進 Siri 及其他智能功能。我們只會對已經過隱私保護強化技術處理的數據進行分析,這樣可確保它們無法關聯到你本人或者你的賬戶。
也就是說,進行分析的數據都是“經過隱私保護強化”的,不應當輕易地被人分辨出事主是誰。
至于拿到數據后分析的過程,蘋果沒有明確說過是真人在分析,還是機器在分析。
但是,就在今年的CES上,蘋果還曾經為保護用戶隱私打出宣言:“在iPhone里發生的,就只會留在iPhone上。”
這就尷尬了,很難說,蘋果的隱私承諾里是否有貓膩。
針對《衛報》這篇報道,蘋果也做出了回應:
Siri的一小部分請求被拿來做分析,以改善Siri的能力。用戶的指令和他們的Apple ID無關。Siri的響應在安全設施中分析,所有審核人員都有義務遵守蘋果嚴格的保密要求。只有不到每日Siri響應的1%被用于評估,而且這些錄音通常只有幾秒鐘。
這樣看來,借助外包公司雇傭真人聽Siri的錄音,蘋果官方是承認的了。
翻車的不只蘋果
讓人類聽智能助手的錄音,蘋果不是第一個翻車的。
今年4月,亞馬遜就被爆出人工智能語音助手Alexa和用戶的溝通都被錄下來,亞馬遜的員工會聽到這些錄音,借此來開發新的服務。
另外不久前,Google Assistant也被比利時公共廣播公司VRT爆料說,有外包團隊負責聽智能助手的錄音。而且雖然谷歌說只有0.2%的錄音會被送去外包公司,但VRT發現,實際上錄音沒有脫敏,完全可以通過討論的內容辨別出包括用戶的地址、親友姓名、感情生活之類的隱私信息。
對訓練AI來說,標注數據集是逃不開的需要,但如果涉及用戶隱私,則總會令人聞之色變。
AI助手廠商們,該行動起來了。
- MEET2020 | 百度景鯤:AI交互正在吃掉舊產品邊界,觸達移動互聯網盲區用戶2019-12-10
- MEET2020 | 王硯峰揭秘搜狗AI技術體系:自然交互在左,知識計算在右,核心是語言2019-12-16
- MEET2020 | 曠視唐文斌:你到底給誰創造了什么樣的價值?這是AI產品的靈魂拷問2019-12-17
- MEET2020 | 快手劉霽:AI基礎能力決定每個公司AI的迭代和落地效率2019-12-20




