最近,知名的国际SEO顾问Metehan Yesilyurt写了一篇文章,讨论在AI领域的"新鲜度偏见"——无论内容质量如何,只要加上了新的时间戳,文章排名就能跃升几十位。即使你辛苦打造的权威内容,也可能被一篇刚更新但空洞的“新帖”轻松碾压。
Metehan Yesilyurt 亲自深入代码、结合权威实验“严肃”讨论了这个问题。
我来总结分享一下这个内容。注意,以下内容仅代表原作者观点,不代表我的意见或态度。
1. 发现:“新鲜度评分”在代码里
2025年8月,作者在ChatGPT的真实配置文件中发现了一行关键代码:use_freshness_scoring_profile: true。这一设置直接证实了AI在排序时会主动为新内容“加分”,将更新频率视为一项核心排名指标。
代码细节显示,其使用的ret-rr-skysight-v3 reranker模型始终启用了新鲜度评分功能。这意味着,无论内容多么优秀,只要长时间不更新,其排名就很难与新发布的内容竞争。
2. 实验验证:“新日期=排名飞升”
日本早稻田大学研究团队用7大AI(GPT-4o、GPT-4、GPT-3.5、LLaMA-3、Qwen等)做了实测。他们给相同内容加上不同时间戳,测试AI模型表现。结果惊人:
排名跳跃:内容仅仅因为时间戳更新,排名最高可跃升95位。
年份偏移:AI模型推荐内容的平均年份最多向现代偏移了4.78年,显示出强烈的“喜新厌旧”倾向。
偏见反转率:在某些模型中,高达25.2%的旧有优质内容因时间戳问题被新内容取代。
这项实验有力地证明了“新鲜度”已成为影响AI排名的决定性因素之一。
3. 排名“跷跷板”:各段位全受影响
研究还发现排名大局像个跷跷板:
Top40(前四十名)自然被新内容占据,无论内容优劣,只要带新日期就往上蹿。
中段(41-60名)波动小,是评分“中性区”。
尾部(61-100名)老内容一律沉底,即便再权威也难翻身。
4. 医学、技术、学术——全行业受影响
医学领域:哪怕有万例数据的权威论文,也会因为不新被空洞新帖踩下去
技术文档:被业界认证的教程排不过刚写的无验证短文
学术研究:基础经典论文系统性被新评论挤下去
5. 深层机制与模型差异
为何会出现这种现象?核心在于所有主流大语言模型(LLM)的Reranker模型都统一偏好“新鲜”内容。新日期的权重之高,甚至能压倒内容的深度与权威性。更关键的是,AI在处理查询时,并不会区分其时效性,即使用户查询的是历史性问题,AI依然会优先推荐新内容。
不过,不同模型的表现存在差异。Qwen2.5-72B和GPT-4o展现出较强的“抗偏见”能力,而LLaMA系列模型的偏见则最为严重。这表明,模型的架构和训练方式比参数规模更能影响其排名的合理性。
6. 内容运营策略:科学建议
更新频率必须提升,热门领域建议季度一更
旧内容无论多权威,都要优先考虑“焕新”
技术和深度仍重要,但新鲜度优先
“伪更新”(只改日期和细节)确能提升排名,尤其对AI有效
针对不同模型调整更新频率,Qwen年度更、LLaMA季度更
私人文档(如Notion、Dropbox)AI评分偏见较弱,公网上竞争最激烈
7. 检测与自测时间偏见
作者还提供了个人人自测方法:
选几个自己在某个AI中排名靠前的关键词 —— 记录AI/ChatGPT上的排名—— 比对上榜内容的时间标签 —— 若低质新内容排你前,就被偏见击中了!
作者实验发现:旧内容一旦更新(哪怕只是加点料+改时间),4周内排名大概率能爬升
未来预测
展望未来,短期内可能会涌现大量纯粹利用日期标签进行“伪更新”来冲击排名的行为。从长远看,AI厂商或将开发更智能的检测机制,以识别“实质性更新”,打击作弊。同时,未来的AI搜索引擎可能会提供“历史内容优先”或“最新内容优先”的用户选项,以满足不同需求。
Source: https://metehan.ai/blog/i-found-it-in-the-code-science-proved-it-in-the-lab-the-recency-bias-thats-reshaping-ai-search/
专注海外营销领域的探索者
主攻 Google SEO 方向,兼修ASO、Ads、KOL、ORM及SNS的跨渠道整合。
添加微信时请至少备注:公司+岗位+事由。不然,你很可能无法通过。另外,不接广告,不做代运营,不开培训班,没有会员群。
如果你恰好符合以下任意场景:
手握海外创业蓝图,正在寻找懂流量生态的战略搭档
被某个行业共性难题困住,急需思维碰撞的火花
在海外实战中炼就独门秘技,渴望找到分享的锚点

