大数跨境

日本最强大模型,把日本网友搞破防了

日本最强大模型,把日本网友搞破防了 观网财经
2026-03-18
3
导读:中国一开源,日本就自研。

(文/陈济深 编辑/张广凯)

中国一开源,日本就自研。

3月17日,日本乐天集团发布Rakuten AI 3.0,宣称是“日本国内最大规模的高性能AI模型”,参数量约7000亿,主打日语能力,在多项基准测试中超越GPT-4o,并获日本经济产业省与NEDO联合发起的GENIAC项目资金支持。

发布当日即遭质疑:该模型在钓鱼岛主权、抗日战争定性等议题上表述客观,承认中方立场及东京审判结论,引发部分日本网民对其“国产性”的怀疑。

后续技术分析证实,其模型配置文件config.json明确标注"model_type": "deepseek_v3"及"architectures": "DeepseekV3ForCausalLM",隐藏层尺寸、专家数量、词表大小等核心参数与DeepSeek V3完全一致。所谓“7000亿参数”实为DeepSeek V3原版6710亿参数的四舍五入表述。

更受诟病的是,乐天最初未在模型包中包含DeepSeek的MIT许可证文件,被指出后才以NOTICE为名补传,版权声明明确标注“Copyright (c) 2023 DeepSeek”。截至目前,乐天集团未就此作出任何公开回应。

“最强日本国产大模型”

乐天官方新闻稿称Rakuten AI 3.0系“基于开源社区最优秀的模型,结合乐天独自的高品质双语数据、技术力和研究成果开发”,全程未提及DeepSeek。

该模型被列为GENIAC第三期成果,训练资源由日本政府资助。GENIAC是由经济产业省与NEDO主导的国家级AI扶持计划,旨在提升日本自主AI基础能力。

值得注意的是,模型权重已公开上传至Hugging Face平台,用户可直接查看config.json等元信息,技术溯源门槛极低。

有日本网友指出:DeepSeek已迭代至V3.2,乐天却选用旧版进行简单微调并冠以“国产最强”之名,缺乏技术诚意。

翻车不是因为抄

DeepSeek V3采用MIT许可证,允许商用与二次开发,乐天使用该模型本身不违法。其争议核心在于三重失当:

1. 宣传刻意模糊来源

此前RakutenAI-7B明确标注“基于Mistral-7B开发”,此次却以“开源社区最优秀的模型”含糊带过,被日本AI研究者批评为刻意回避。

2. 许可证处理严重失范

未同步开源许可证属基本合规疏漏,事后补传仅体现被动应对,损害技术伦理公信力。

3. 公共资金用途背离初衷

GENIAC项目本质是用纳税人资金培育本土AI根基,而乐天将中国开源模型经日语微调后包装为“日本国产最大规模模型”,与政策目标明显相悖。

多位日本评论者认为:若坦承“当前尚不具备从零构建基座模型的能力,故选择DeepSeek进行本地化优化”,反而会被视为务实策略;遮掩事实,才是引发信任危机的主因。

此事在日本社会语境下更具象征张力。2025年1月底,DeepSeek以低成本、高性能横空出世,其iPhone应用登顶全球免费榜,触发美股科技股震荡,“DeepSeek冲击”致英伟达单日市值蒸发近6000亿美元,被日本媒体称为“AI界的黑船来航”。

“黑船”典出1853年佩里舰队叩关,象征不可阻挡的外部技术冲击。今日DeepSeek所引发的,正是类似级别的认知震动——日本政府迅速出台限制指引,丰田、三菱重工、软银等头部企业全面禁用;意大利、台湾地区、美国国防部、NASA、澳大利亚、韩国等亦相继采取封禁或审查措施。

在此背景下,乐天以国家补助资金“套壳”DeepSeek并高调宣称为“日本最强AI”,加剧了公众对技术诚信与公共资金使用的质疑。

有日本网友调侃:“日本AI已周回遅れ(落后一圈),唯一路径就是进口海外开源模型追加训练,再喊一句‘ハイ国産です~’(哈,国产的哟~),完成产地伪造+国籍洗白。”

另有用户实测乐天AI官网功能,发现其具备图像理解能力——而DeepSeek V3及Rakuten AI 3.0均不支持图像输入。推测官网实际运行模型或为Claude或GPT系列,进一步削弱其“自研”可信度。

172年前,佐久间象山提出“以夷之术制夷”;172年后,乐天确引进了中国技术,但未用于增强国力,而是用于增强PPT。

【声明】内容源于网络
0
0
观网财经
各类跨境出海行业相关资讯
内容 5188
粉丝 0
观网财经 各类跨境出海行业相关资讯
总阅读39.2k
粉丝0
内容5.2k