机器遗忘(Machine unlearning)是机器学习的一个新型子领域, 旨在消除训练模型中训练数据子集的影响,比如隐私、政治、偏见等。
背景
最近这几年人工智能越来越猛,算法和模型的变化就像过山车一样刺激。
而深度学习最近在广泛的应用中推动了巨大进步,但是过程中也出现了很多问题,比如:
• ChatGPT 数据泄露事件
• 各大公司对 ChatGPT 等人工智能的限制使用等等
这这背后都指向了机器学习中的数据隐私问题。
什么是机器遗忘(白话)
人工智能(深度学习)就像一个你的超级学霸室友, 可以学习成绩贼牛逼,记忆力超好,过目不忘,会唱歌会画画,德智体全面发展。但是,有一天你发微信告诉他了一个秘密;
此时,人工智能(深度学习模型)就像这个学霸的大脑一样,记住用于训练它们的数据(这个秘密);
然后你要求忘记这个秘密,删除数据并不能确保模型忘记这个知识, 就想你删除微信消息并不能让他忘记这个秘密一样。
而机器遗忘就是要教会这个学霸来忘记秘密。
这是一个新的技术领域,旨在使深度学习模型忘记某些数据(例如删除特定记忆)而不影响其智能性。
谷歌机器遗忘挑战赛
谷歌发起了谷歌遗忘挑战赛,可以到下面网站查看详情:

https://ai.googleblog.com/2023/06/announcing-first-machine-unlearning.html
--- END ---

