大数跨境

三百万张约会照"喂"了AI,这场十二年隐私旧账终于算了

三百万张约会照"喂"了AI,这场十二年隐私旧账终于算了 洞见畏来
2026-04-22
3
导读:你在交友软件上精心挑选的照片,可能早已成为别人训练算法的"养料"。而当这一切终于被揭开时,距离事发已经过

你在交友软件上精心挑选的照片,可能早已成为别人训练算法的"养料"。而当这一切终于被揭开时,距离事发已经过去了整整十二年。

               
一封邮件,三百万张照片就这么交出去了

这事得从2014年说起。

AI创业公司Clarifai的创始人兼CEO Matthew Zeiler,当时给OkCupid的联合创始人Maxwell Krohn发了封邮件。邮件内容直白得近乎天真,又让人脊背发凉:"我们正在收集数据,刚意识到OkCupid肯定有一大堆超棒的数据可以用。"

"超棒的数据"——他说的是用户上传的头像、生活照,以及附着在这些照片上的年龄、性别、地理位置等个人信息。

更耐人寻味的是两边的关系。OkCupid背后站着约会软件巨头Match Group,而OkCupid的几位高管当时恰好还投资了Clarifai。这种"利益交织"的格局,让这封"求数据"的邮件显得格外顺理成章。

结果也毫无悬念:OkCupid真的就把用户照片交了出去,足足三百万张。用户们对此毫不知情,毕竟按照OkCupid自己白纸黑字写下的隐私政策,这种未经许可的数据共享行为,压根就不应该发生。

可规则是规则,生意是生意。在用户每天左滑右滑的时候,他们的面容已经被悄悄输入了一套人脸识别系统的训练池。

               
从媒体曝光到监管介入,隔了整整五年

要说这件事最魔幻的地方,莫过于它被发现的过程。

三百万张照片在2014年就流出了,但FTC——美国联邦贸易委员会——直到2019年才正式展开调查。导火索是《纽约时报》的一篇报道,提到Clarifai用OkCupid用户的照片开发了一款可以估算年龄、性别和种族的AI工具。换句话说,是记者先发现了问题,监管部门才后知后觉地跟上

FTC的调查随后持续了数年。期间还有一件让人皱眉的事:监管机构指控,自2014年以来,Match Group和OkCupid不仅刻意隐瞒数据外泄,还试图阻碍调查。直到上个月,这场拉锯战才算暂时画上句号。十二年,足够一个婴儿从小学读到高中。可对于那些照片被"借用"的用户来说,他们的知情权却被拖欠了如此之久。

               
和解书上,没有人承认自己做错了

FTC与Match Group、OkCupid的和解协议,读起来有一种微妙的荒诞感。

一方面,Clarifai已经确认,那三百万张OkCupid用户照片连同基于这些数据训练出来的AI模型,都已被删除。这在某种程度上等于间接承认了当年的数据交易确实存在。

另一方面,Match Group和OkCupid在和解时,并没有承认任何欺骗用户的指控。也就是说,钱或者代价可能付了(虽然具体情况未公开),但嘴上绝不认错。

这种"和解但不认错"的套路,在大型科技公司中屡见不鲜。它释放了一个暧昧的信号:公司愿意花钱平息风波,却并不认为自己侵犯了用户权益。对于那些照片被用于训练AI的普通用户来说,这种姿态很难说是一种安慰。

FTC在和解声明中还透露了一个关键指控:Match Group和OkCupid在过去这些年里,一直在系统性地掩盖数据共享行为。如果不是媒体报道扯开了口子,再加上监管机构持续施压,公众或许永远不会知道这三百万张照片的去向。

               
法律能做的,其实非常有限

很多人可能会问:这么严重的事,罚款呢?赔偿呢?

答案是:没有罚款。至少FTC在这个案子里没有开出罚单。根据现行法律,FTC对这类"初犯"并没有直接罚款的权力。他们能做的,主要是发布禁令——宣布OkCupid和Match Group"永久被禁止在数据收集和共享上做出虚假陈述"

翻译成人话就是:以前的事既往不咎,但以后不准再这么干了。而这些被禁止的行为,本来就违反了规定。

这个结局让人不免感到一种深深的无力感。当一家公司的隐私政策沦为摆设,当数据在利益交换中悄然流转,当监管姗姗来迟,最后换来的不过是一纸"下不为例"的禁令。对于那些已经被喂给算法的面孔,谁来负责?

关键节点 时间 核心事件
数据外泄 2014年 Clarifai向OkCupid索要用户照片,获三百万张及人口统计信息
邮件往来 2014年 Clarifai CEO发邮件称OkCupid拥有"超棒的数据"
媒体曝光 2019年 《纽约时报》报道引发公众与监管关注
调查启动 2019年 FTC正式对Match Group及OkCupid展开调查
和解达成 2025年3月 Match Group、OkCupid与FTC达成和解
数据删除 2025年 Clarifai确认删除全部照片及基于该数据训练的AI模型

               
当"同意"成为一种形式,我们还能相信什么

OkCupid这件事之所以值得被记住,不只是因为三百万这个数字够大,而是因为它戳中了一个当下每个人都无法回避的痛点:你的隐私,到底在多大程度上还是你的?

仔细想想,我们几乎每天都在点击"同意隐私政策"。那些动辄上万字的条款,有多少人真的读过?即便读了,里面埋藏的模糊表述和宽泛授权,又有多少人能真正看懂?而即便看懂了,你真的有选择不同意的权利吗?

OkCupid的案例最讽刺的地方在于,它连表面功夫都懒得做足——自己的隐私政策明明禁止未经授权的数据共享,却还是照做不误。这等于告诉用户:规则是我写的,但什么时候遵守、遵守多少,我说了算。

在这个算法越来越懂你的时代,你的照片、你的偏好、你的位置、你的消费习惯,都是训练AI的宝贵素材。但"宝贵"的前提,绝不应该是暗箱操作和利益交换,而应该是明确的知情和真正的自愿同意

下一次,当你在App里面对"同意"按钮时,不妨多停留几秒。你点击的,可能不只是一份协议,而是对自己数字人格的又一次让渡。而那些接收数据的公司,是否真的值得你这份信任?

答案,或许就藏在它们过去十二年里做过的事情中。

【声明】内容源于网络
0
0
洞见畏来
专注于前沿科技趋势,剖析底层算法逻辑,深耕商业化场景落地
内容 633
粉丝 0
洞见畏来 专注于前沿科技趋势,剖析底层算法逻辑,深耕商业化场景落地
总阅读228
粉丝0
内容633