三百万张约会照"喂"了AI，这场十二年隐私旧账终于算了- 大数跨境

首页

三百万张约会照"喂"了AI，这场十二年隐私旧账终于算了

洞见畏来

2026-04-22

导读：你在交友软件上精心挑选的照片，可能早已成为别人训练算法的"养料"。而当这一切终于被揭开时，距离事发已经过

你在交友软件上精心挑选的照片，可能早已成为别人训练算法的"养料"。而当这一切终于被揭开时，距离事发已经过去了整整十二年。

一封邮件，三百万张照片就这么交出去了

这事得从2014年说起。

AI创业公司Clarifai的创始人兼CEO Matthew Zeiler，当时给OkCupid的联合创始人Maxwell Krohn发了封邮件。邮件内容直白得近乎天真，又让人脊背发凉："我们正在收集数据，刚意识到OkCupid肯定有一大堆超棒的数据可以用。"

"超棒的数据"——他说的是用户上传的头像、生活照，以及附着在这些照片上的年龄、性别、地理位置等个人信息。

更耐人寻味的是两边的关系。OkCupid背后站着约会软件巨头Match Group，而OkCupid的几位高管当时恰好还投资了Clarifai。这种"利益交织"的格局，让这封"求数据"的邮件显得格外顺理成章。

结果也毫无悬念：OkCupid真的就把用户照片交了出去，足足三百万张。用户们对此毫不知情，毕竟按照OkCupid自己白纸黑字写下的隐私政策，这种未经许可的数据共享行为，压根就不应该发生。

可规则是规则，生意是生意。在用户每天左滑右滑的时候，他们的面容已经被悄悄输入了一套人脸识别系统的训练池。

从媒体曝光到监管介入，隔了整整五年

要说这件事最魔幻的地方，莫过于它被发现的过程。

三百万张照片在2014年就流出了，但FTC——美国联邦贸易委员会——直到2019年才正式展开调查。导火索是《纽约时报》的一篇报道，提到Clarifai用OkCupid用户的照片开发了一款可以估算年龄、性别和种族的AI工具。换句话说，是记者先发现了问题，监管部门才后知后觉地跟上。

FTC的调查随后持续了数年。期间还有一件让人皱眉的事：监管机构指控，自2014年以来，Match Group和OkCupid不仅刻意隐瞒数据外泄，还试图阻碍调查。直到上个月，这场拉锯战才算暂时画上句号。十二年，足够一个婴儿从小学读到高中。可对于那些照片被"借用"的用户来说，他们的知情权却被拖欠了如此之久。

和解书上，没有人承认自己做错了

FTC与Match Group、OkCupid的和解协议，读起来有一种微妙的荒诞感。

一方面，Clarifai已经确认，那三百万张OkCupid用户照片连同基于这些数据训练出来的AI模型，都已被删除。这在某种程度上等于间接承认了当年的数据交易确实存在。

另一方面，Match Group和OkCupid在和解时，并没有承认任何欺骗用户的指控。也就是说，钱或者代价可能付了（虽然具体情况未公开），但嘴上绝不认错。

这种"和解但不认错"的套路，在大型科技公司中屡见不鲜。它释放了一个暧昧的信号：公司愿意花钱平息风波，却并不认为自己侵犯了用户权益。对于那些照片被用于训练AI的普通用户来说，这种姿态很难说是一种安慰。

FTC在和解声明中还透露了一个关键指控：Match Group和OkCupid在过去这些年里，一直在系统性地掩盖数据共享行为。如果不是媒体报道扯开了口子，再加上监管机构持续施压，公众或许永远不会知道这三百万张照片的去向。

法律能做的，其实非常有限

很多人可能会问：这么严重的事，罚款呢？赔偿呢？

答案是：没有罚款。至少FTC在这个案子里没有开出罚单。根据现行法律，FTC对这类"初犯"并没有直接罚款的权力。他们能做的，主要是发布禁令——宣布OkCupid和Match Group"永久被禁止在数据收集和共享上做出虚假陈述"。

翻译成人话就是：以前的事既往不咎，但以后不准再这么干了。而这些被禁止的行为，本来就违反了规定。

这个结局让人不免感到一种深深的无力感。当一家公司的隐私政策沦为摆设，当数据在利益交换中悄然流转，当监管姗姗来迟，最后换来的不过是一纸"下不为例"的禁令。对于那些已经被喂给算法的面孔，谁来负责？

关键节点	时间	核心事件
数据外泄	2014年	Clarifai向OkCupid索要用户照片，获三百万张及人口统计信息
邮件往来	2014年	Clarifai CEO发邮件称OkCupid拥有"超棒的数据"
媒体曝光	2019年	《纽约时报》报道引发公众与监管关注
调查启动	2019年	FTC正式对Match Group及OkCupid展开调查
和解达成	2025年3月	Match Group、OkCupid与FTC达成和解
数据删除	2025年	Clarifai确认删除全部照片及基于该数据训练的AI模型

当"同意"成为一种形式，我们还能相信什么

OkCupid这件事之所以值得被记住，不只是因为三百万这个数字够大，而是因为它戳中了一个当下每个人都无法回避的痛点：你的隐私，到底在多大程度上还是你的？

仔细想想，我们几乎每天都在点击"同意隐私政策"。那些动辄上万字的条款，有多少人真的读过？即便读了，里面埋藏的模糊表述和宽泛授权，又有多少人能真正看懂？而即便看懂了，你真的有选择不同意的权利吗？

OkCupid的案例最讽刺的地方在于，它连表面功夫都懒得做足——自己的隐私政策明明禁止未经授权的数据共享，却还是照做不误。这等于告诉用户：规则是我写的，但什么时候遵守、遵守多少，我说了算。

在这个算法越来越懂你的时代，你的照片、你的偏好、你的位置、你的消费习惯，都是训练AI的宝贵素材。但"宝贵"的前提，绝不应该是暗箱操作和利益交换，而应该是明确的知情和真正的自愿同意。

下一次，当你在App里面对"同意"按钮时，不妨多停留几秒。你点击的，可能不只是一份协议，而是对自己数字人格的又一次让渡。而那些接收数据的公司，是否真的值得你这份信任？

答案，或许就藏在它们过去十二年里做过的事情中。

【声明】内容源于网络

洞见畏来

专注于前沿科技趋势，剖析底层算法逻辑，深耕商业化场景落地

内容 633

粉丝 0

洞见畏来专注于前沿科技趋势，剖析底层算法逻辑，深耕商业化场景落地

总阅读228

粉丝0

内容633