IBM未經(jīng)許可將用戶照片用于AI訓(xùn)練
當(dāng)面部識(shí)別成為越來越廣泛應(yīng)用的技術(shù),隨之而來的是關(guān)于個(gè)人數(shù)據(jù)隱私泄露的擔(dān)憂。IBM這次就撞在了槍口上。近日,外媒報(bào)道曝光IBM未經(jīng)許可,利用網(wǎng)絡(luò)相冊(cè)Flickr上近100萬張個(gè)人照片,訓(xùn)練它們面部識(shí)別系統(tǒng),同時(shí)與外部研究人員共享這些照片。
眾所周知,機(jī)器學(xué)習(xí)的關(guān)鍵就是大量的數(shù)據(jù)訓(xùn)練,人臉識(shí)別算法亦然。為了提高算法的精確度,需要標(biāo)注上百萬的照片來訓(xùn)練AI。
據(jù)了解,在Flickr上傳照片的用戶并不同意IBM將其照片用于開發(fā)面部識(shí)別系統(tǒng),因?yàn)檫@些可能最終會(huì)被用來監(jiān)視和識(shí)別他們。一位攝影師透露:“我拍攝的人中沒有一個(gè)人知道他們的照片是以這種方式使用的!
這些照片被IBM統(tǒng)稱之為訓(xùn)練數(shù)據(jù)集,他們已經(jīng)對(duì)照片上人物的膚色、性別、面部輪廓等做了詳細(xì)的標(biāo)注。
盡管IBM保證Flickr用戶可以選擇退出數(shù)據(jù)庫,但報(bào)道該事件的媒體NBC新聞發(fā)現(xiàn),刪除照片幾乎是不可能的。IBM要求攝影師通過電子郵件發(fā)送他們想要?jiǎng)h除的照片的鏈接,但該公司尚未公開分享數(shù)據(jù)集中包含的Flickr用戶和照片列表,因此沒有簡(jiǎn)單的方法可以找到包含哪些照片。
這幾年隨著面部識(shí)別的大規(guī)模應(yīng)用,不少科技公司都和IBM一樣,抓取網(wǎng)絡(luò)上公開、非商業(yè)性質(zhì)的圖片、視頻來訓(xùn)練AI程序。
此次被曝光的IBM數(shù)據(jù)訓(xùn)練集就是YFCC100M照片庫的一部分,YFCC100M是Flickr前東家雅虎為進(jìn)行研究而收集的照片數(shù)據(jù)庫。所有照片都是在CreativeCommonsLicense版權(quán)協(xié)議下共享的,這種版權(quán)協(xié)議表明照片可以自由使用,但存在一些限制。
面對(duì)質(zhì)疑,IBM表示數(shù)據(jù)集不會(huì)將人臉的照片與其姓名相關(guān)聯(lián),而且他們的目標(biāo)是為了解決算法的偏差,以防可能出現(xiàn)的種族歧視。但是,公民自由倡導(dǎo)者和技術(shù)倫理研究人員仍然質(zhì)疑IBM的動(dòng)機(jī),因?yàn)镮BM也在銷售人臉識(shí)別系統(tǒng),這些工具因侵犯公民自由一直受到批評(píng)。
有業(yè)內(nèi)人士指出,IBM和Facebook等公司的研究機(jī)構(gòu)和商業(yè)運(yùn)營(yíng)之間的區(qū)別是模糊的。即使算法由學(xué)術(shù)研究人員使用非商業(yè)數(shù)據(jù)集開發(fā),它們通常也會(huì)被企業(yè)使用。

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
即日-9.16點(diǎn)擊進(jìn)入 >> 【限時(shí)福利】TE 2025國際物聯(lián)網(wǎng)展·深圳站
-
10月23日火熱報(bào)名中>> 2025是德科技創(chuàng)新技術(shù)峰會(huì)
-
10月23日立即報(bào)名>> Works With 開發(fā)者大會(huì)深圳站
-
10月24日立即參評(píng)>> 【評(píng)選】維科杯·OFweek 2025(第十屆)物聯(lián)網(wǎng)行業(yè)年度評(píng)選
-
11月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
12月18日立即報(bào)名>> 【線下會(huì)議】OFweek 2025(第十屆)物聯(lián)網(wǎng)產(chǎn)業(yè)大會(huì)
推薦專題
- 1 阿里首位程序員,“掃地僧”多隆已離職
- 2 先進(jìn)算力新選擇 | 2025華為算力場(chǎng)景發(fā)布會(huì)暨北京xPN伙伴大會(huì)成功舉辦
- 3 人形機(jī)器人,正狂奔在批量交付的曠野
- 4 宇樹機(jī)器人撞人事件的深度剖析:六維力傳感器如何成為人機(jī)安全的關(guān)鍵屏障
- 5 解碼特斯拉新AI芯片戰(zhàn)略 :從Dojo到AI5和AI6推理引擎
- 6 AI版“四萬億刺激”計(jì)劃來了
- 7 騰訊 Q2 財(cái)報(bào)亮眼:AI 已成第二增長(zhǎng)曲線
- 8 2025年8月人工智能投融資觀察
- 9 10 Manus跑路,大廠掉線,只能靠DeepSeek了