最近陆续看到国内一些类 Hugging Face 平台推出,我想说一些自己的观点,结论如标题所述,注定失败,欢迎对号入座。(以下 Hugging Face 也叫抱抱脸)
观点一:Hugging Face 不是 Github
有很多人把 Hugging Face 定位为大模型时代的 Github ,这其中也包括两年前的我。所以两年前我们躬身入局推出模力方舟的第一版来致敬抱抱脸。而后只用了不到半年时间我就意识到我错了,然后快速的调整模力方舟的方向。
那时候正是国内大模型最疯狂的百模大战的时间点啊。疯狂的时候想要保持清醒太难了,可是我们发现当时的那种疯狂只是止步于各种媒体激情澎湃的文章中、各种会议唾沫横飞的演讲中。
可是模型在哪?在嘴里?在 PPT 里?天知道。
时间很快就来到了2025,现在 2025也快过去了,我们再数数现在的大模型数量,还剩下多少?
Github 不同,干过程序员的多少都会写点代码,不管是 Github 或者是 Gitee ,平均每个账号拥有3~5个代码仓库,不管是总数还是增量都是几个量级的差距。
当然你肯定会说抱抱脸上已经有超过200万的模型,而且增长迅速。那我继续说下面的观点。
观点二:开源大模型不具备协作开发的基础
不管是代码仓,还是模型仓,单纯仓库的数量毫无意义,因为这些都是死的,而开源的核心价值是协作。
严格意义上说开源大模型更多只是开放权重,好一点的会把训练过程也公开了,但是非常核心的训练数据,目前除了一些纯教学目的的玩具模型,其他几乎没有公开的。
数据的问题,导致无法重现模型的过程,这一点就完全阻止了协作的可能性。没有协作,大模型托管平台就沦为下载站,而早期的下载站早已沦为靠骗用户点击广告苟活了。
当然,模型下载站对用户来说是有价值的,现在的模型体积都巨大,更高的带宽、更快的下载速度肯定是大家喜闻乐见的,但背后巨大的带宽成本,谁来承担,能承担多久🤔
观点三:照猫画虎只会画出一只三脚猫
抱抱脸这个公司在商业上和生态上都很成功,但是我们看到的可能仅仅是 Hugging Face 这个网站所展示出来样子。这两年我们密切的关注着这个平台,发现他们也做了很多改变和试错。基于一个毫无根据的感受:现在的 AI 不是我心目中理想的样子,所以我非常主观的认为目前的产品绝不是他们满意的样子,下面一定还会有其他大刀阔斧的变化出来。
今天的大模型发展太迅猛了,国内的开源大模型在全球上不管是评测数据还是使用率都已经真正的遥遥领先了。但是作为基础设施的开源大模型平台,如果不思进取、一味的抄袭复刻,那这句话有点难听。说得再直白一点,在国内,如果说到今天还在幻想通过复刻两年前的 Hugging Face 是注定失败的。
今天借此文章我们也自勉一下:模力方舟(moark.com)将持续坚持拥抱 AI 应用开发者,坚持拥抱国产算力,不断探索,蹚出一条特色的路。
想到哪说到哪,胡喷,喷完。

