大数跨境

用ChatGPT打爆街霸

用ChatGPT打爆街霸 蚍蜉视界
2023-04-27
1
导读:一边看AI是如何学习的,一边思考世界会怎样因它改变
点击上方蓝字“蚍蜉视界”关注我吧

终于有人拿AI干点正事了,用它来打游戏

拳皇、街霸、星际、红警、魔兽……在这些上古游戏里,当你与最高困难等级的电脑人PK的时候,总是被他们揍到怀疑人生。

比如街霸II,哪怕你有全游戏厅最敏捷的反应和最快的手速,也不是最终Boss红衣警察的对手,更别提一睹通关后的神秘剧情。

而今随着GPT的横空出世,就有一位叫林亦LYi的博主想试着用它实现儿时的梦想。

于是他让GPT写了一套AI算法,要求让AI通过图像识别学会操控游戏角色去与红衣警察对抗,任务是获得胜利。

很快,GPT就给出了相应代码。但初始版本肯定有这样那样的问题,于是GPT与街霸II之间又进行了多次沟通交流,而博主作为人类只扮演了传话筒的角色。

最终,一套可以持续运行且没有明显BUG的代码被写了出来,博主立马带着它进入了街霸的世界……

经过无数次的学习与迭代,AI的表现很有意思。从统计出的数据来看,一开始AI的胜率就在持续下降,而每局的平均耗时却在不断增加。

大家猜下这是为什么?

答案就是AI被红衣警察打怂了,它一开始还有些进攻动作,但是慢慢的招术就变成了躲在角落里保持防守动作挨打。

再后来连每局的平均耗时也开始不断减少,说明这个版本的算法什么都没学到。

上曲线为平均每局对战时长,下曲线为胜率统计

这真是像极了这几年进入社会的年轻人,几经折腾下来挨揍多奖励少,根本没机会知道怎么做是对的,只能无助地往后躲,越来越看不到希望。最后干脆选择了躺平,一败涂地。

针对这种螺旋下坠的情况,博主开始修改算法中的奖惩机制。

首先他扮演高高在上的领导,让AI在输掉一局后被扣更多的分数,结果是AI以更快的速度螺旋下坠,彻底摆烂了;于是博主换了一套正面激励的方法,比如说尽管这一局游戏输了,但如果AI能让对手掉血就可以少扣一些分,如果能把对手打成残血还能够获得加分。

当然,这些代码也是博主让GPT帮他写的,他只需说出自己的想法。

这一次,博主见识到了AI的恐怖实力。

得到正向激励的AI如同昭和男儿般同时打开了16个游戏窗口,并在每个窗口里以7倍的速度运行游戏进行训练,这种毁天灭地的效率仅需要博主的一台个人电脑就能运行。


仅仅过了几个小时,AI便让博主实现了多年来的梦想:红衣警察被揍到亲妈都不认识了,而AI却一丝血都没掉。细看游戏过程中,AI控制的小人上蹿下跳屡出连招,根本不给红衣警察任何机会,像极了红衣警察过去这么多年不给博主任何机会一样,太解气了!

不过我们还不能高兴的太早,因为这个游戏是三局两胜制,AI需要再胜一局才能让博主看到通关后的神秘剧情。

然而AI在第二局的表现却令人大跌眼镜。它虽然打出了一些漂亮招数,也让红色警察受了伤,但最后却输掉了比赛。

博主仔细观看了比赛录像,发现红色警察在第二局的时候使用了和第一局不一样的打法,而之前AI一直是以第一局为环境进行的训练

奇怪,AI明明是自学习的,按理说它应该能针对红衣警察的不同招数作出不同的反应,而不是有如此之大的反差。

于是博主又查看了AI的学习曲线,这才发现了端倪,原来是AI发生了“过拟合”。

也就是说,AI一开始确实是在根据红衣警察的各种招数来灵活训练自己的应变,但红衣警察毕竟是一段上古代码,它的套路是有限的,AI在经过一番学习探索后总结出了一套制胜打法,并不断精益求精。而这也是个让AI“走火入魔”的过程:现在的AI忘掉了随机应变,变成了一个只能打败第一局红衣警察的杀手,一旦打法发生变化,AI就无法应对了。

解决的办法也不难,那就是截取出AI在训练过程中已经获得了相当知识储备但尚未“火入魔”的状态(比如说第37分钟迭代了250万步的时候),这个状态下的AI胜率很高,同时也没有忘记随机应变。

博主让这个状态的AI去应对第二局,结果AI不负众望,在第二次尝试时就击败了红衣警察。

最后,博主终于见到了通关后的剧情:主人公并没有去领什么奖,而是迫不及待踏上了下一段旅程……

瞪大双眼看完了博主的这一番骚操作后,我总结了三个道理:

第一,未来的人将被分为会使用AI的人和不会使用AI的人。别看博主今天拿着AI打游戏好像人畜无害还有点玩物丧志的样子,但是这个强大的工具分分钟就能应用到各行各业,以恐怖的效率完成大量工作的同时,代替掉很多人的岗位。我们要立马思考在即将到来的AI时代里自己面临的危险与机遇;

第二,连AI在面对持续的负激励的时候都会选择躺平摆烂,更何况人。希望朝堂和社会多关心当下年轻人的训练环境,不要连着练废几代人,因为他们的状态就是国家未来的状态。最近三十年痛失互联网、新能源等产业机遇的日本已是前车之鉴。

第三,掌握充足知识的同时要避免让自己陷入“过拟合”状态,否则无法面对变化的环境。正如乔布斯所说:Stay hungry, Stay Foolish。

【声明】内容源于网络
0
0
蚍蜉视界
啥都写点,啥都不会
内容 75
粉丝 0
蚍蜉视界 啥都写点,啥都不会
总阅读0
粉丝0
内容75