半导体界有一句传统俗语:有晶圆厂的才是真男人(real men have fabs)。然而,这句话放在今时今日,显得有点不合时宜。
日前,半导体制造巨擘英特尔才因制程落后,拖垮整个企业的竞争力,连“镇店之宝” CPU 都要交给台积电代工,更引发首席工程师 Murthy Renduchintala 打包走人,为 7nm 的重大失误扛下责任。
近年来英特尔在 CPU 和 GPU 领域上的两大竞争对手 AMD 和 Nvidia 气势如虹,也都是纯晶圆厂 Fabless 模式。当年,还没有剥离格芯 GlobalFoundries 厂房的 AMD ,营运还处于困境,由此可知,是不是“真男人”和有没有晶圆厂,早已无关系。
相较于英特尔从 10nm 制程出现大延宕,7nm 干脆考虑外包给台积电生产,那台积电的制程是什么时候开始追上来的呢?
十万青年十万肝、台积轮班救台湾
这要追溯至 2014 年台积电创办人张忠谋提出的“夜鹰计划”,挑选菁英工程师以 24 小时三班制轮班方式,加速 10nm 制程研发。
当时网络上针对台积电的“夜鹰计划”还流行着一句话:“十万青年十万肝、GG(台积电)轮班救台湾”、“十万青年十万肝、一人一肝救台湾” 。
台积电 10nm 在“夜鹰计划”鞭策下,终于是如期量产。现在回头看,英特尔就是从 10nm 制程一延四年开始“掉队”; 这样一进与一退,成了今日的现况。
一位曾担任英特尔晶圆代工部门(Intel Custom Foundry)的高阶主管对问芯Voice 表示,英特尔这次的危机未必是坏事,因为长期以来内部资源是完全集权于 CPU 制程研发团队,无视于外部压力,且永远慢慢做,导致错过很多机会,现在有危机才能引导出权力的转换,才能有转机出现。
英特尔究竟是如何从不可一世的半导体制造巨擘,走入制程技术一代代延宕的“魔咒”当中? 在本文中,引用一位曾任职于英特尔的工程师的看法,揭露了当中许多“一错再错”的关键秘辛。
英特尔内部“横着走”的TMG事业群
英特尔的技术与制造事业群 TMG(Technology and Manufacturing Group)长年以来是集大权于一身,内部形容 TMG 势力之大,连历届的首席执行官都“不敢轻易动这个部门的一根汗毛”。
TMG 事业群在英特尔内部会如此呼风唤雨,当然是因为英特尔的制程技术和制造工艺长年以来始终位居领先地位。
一直到 2018 年 10nm 制程一延多年,对英特尔造成前所未有的挑战,TMG 事业群才有了一次重大改组。
当时,英特尔 TMG 事业群高管 Sohail Ahmed 退休后,将晶圆制造业务拆分为三部分:技术研发(Technology Development)、制造与运营(Manufacturing and Operations)、供应链(Supply Chain),且分别由三个不同高管来负责。
这三个部门高管的直属老板是谁?是英特尔在 2015 年从高通挖角过来的技术大将 Murthy Renduchintala 。他也是因为这次 7nm 重大失误要再延 6 个月,而下台负责的技术高管。
其实,在 2012 年 22nm 制程世代之前,英特尔眼里根本没有台积电和三星电子。
英特尔Tick-Tock钟摆“当机”
英特尔的 22nm 制程是全球第一个从平面式晶体管,转换成 3D 结构 FinFET 架构的半导体厂; 在当时,英特尔的 CPU 还能维持长年以来的 CPU 奉行的 Tick-Tock 规律。
所谓的 Tick-Tock 是钟摆发展模式,也是英特尔在 CPU 产品上的战略模式。 “Tick”代表着一代 CPU 芯片制程的更新,“Tock”代表着在上一次“Tick”的芯片制程基础上,更新 CPU 架构来提升效能。
一般“Tick-Tock”的周期为两年,当中“Tick”一年、“Tock”一年。英特尔认为,将两者更新的时间错开后,搭配起来会更有效率。
一直到在 22nm 制程时代,英特尔基本上还能维持 Tick-Tock 规律。然而,这样的状况发展到 2014 年,英特尔内部已经隐隐感到一丝不妙。
因为,当年采用 14 奈米生产的 Broadwell 处理器延到下半年量产,接下来的 10nm、7nm 接连迟到,导致最后所有的产品都挤在 14nm 制程世代,演变成 14nm 大缺货危机。
业界笑称,英特尔传统的 Tick-Tock 规律在钟摆“当机”后,从 Tick-Tock-Tick-Tock-Tick-Tock 开始变成 Tick-Tock-Tock-Tock 无限循环,最后没人在讲 Tick-Tock 规律,大家只知道 TikTok(抖音)了。
为什么英特尔接棒 14nm 的 10nm 制程延宕这么久?前离职员工爆料,英特尔对于晶体管密度有着魔般的痴迷,追求同样面积能塞越多晶体管越好。
这样做有个好处,每当有分析师拿出台积电或三星的策略来质疑英特尔时,英特尔只要拿出最漂亮的晶体管密度数字,一招打遍天下无敌手,分析师们自然乖乖闭嘴。但到了后期,这招越来越无法封住分析师的嘴。
再者,英特尔针对 10nm 的规格订得太高,一昧只追求最漂亮的晶体管密度,可是 TMG 部门的人是拼死拼活也做不到那个良率标准,10nm 自然一年延宕过一年。
CPU 设计部门也是耐心磨尽,认为只要先把 CPU 做出来再说,不要一下子把晶体管密度标准定那么高。但英特尔内部一向是 TMG 部门的人说的算,时间久了,最后 CPU 设计部门也没力气搞Tock(架构)了。
不过,倒是英特尔内部 GPU 部门的人挺享受这样 Tick-Tock-Tock 的速度。因为 GPU 本来就是重视晶体管密度大于速度,也刚好让 GPU 团队有时间搞一些PPA(功耗、性能、面积)的研究,然后反馈给TMG部门。
有了 10nm 的教训,英特尔在 7nm 制程时稍微放宽了一点标准。不过,英特尔骄傲血统再度作祟,传出 7nm 制程一开始是要挑战 FinFET 下一代的 GAA 架构(Gate-All-Around),只要这一步成功了,就有机会一雪“前耻”,来个大幅度的超前。
只是这一条路难度太高,最后还是决定回归 FinFET 路线,回归“做出一颗不错的 7nm CPU”就好的务实想法。
关于 GAA 架构,原本传出台积电和三星在 3nm 制程要转进,但后来台积电表示,决定仍让 3nm 制程维持 FinFET 架构。
英特尔这次则是传出会在 5nm 时导入,主要是因为公司曾对外表示,要在 5nm 重新夺回制程领先的地位。业界推测,转进 GAA 架构会是一个超车的方式。
英特尔产品线的“长幼有序”
以 14nm 和 10nm 制程交替为例,根据英特尔的习惯,当 14nm 制程在量产时,10nm 制程也同步开发差不多等待接棒,由设计部门先准备好。
通常会是由设计周期比较短的 GPU 先采用,然后再恭迎 CPU 老大哥上场,之后再由服务器芯片接棒。过程中,10nm 产量持续增加,由 10nm 逐渐取代 14nm 产能做量产。
除了上述这些芯片之外,英特尔其实还有许多各式各样的芯片也在一旁等着。毕竟这几年下来英特尔也“收藏”了不少公司,例如是英飞凌手机芯片部门(改名为iCDG)、FPGA 供应商 Altera(改名为PSG)、人工智慧Nervana(改名AIPG)、自动驾驶 Mobileye 等。
英特尔前员工透露,内部还有一些所谓的“浪人团队”,就是原本也隶属于正规组织,后来因为这些正规组织被解散了(如英特尔的晶圆代工部门 Intel Custom Foundry),导致这些“浪人团队”需要在内部“打工”维持生计。例如服务器部门要做存储控制芯片,但又碍于人手不够,就会委托“浪人团队”来做。
不过,英特尔内部的设计团队也是很竞争,“浪人团队”的竞争对手也是不少,像是印度班加罗尔也设有研发中心,还有马来西亚槟城也有设计中心等。
英特尔找上台积电代工的缘由
上述提到,因为英特尔 10nm 难产,导致所有产品都挤在 14nm 制程这个时代,不但造成整个规划蓝图大乱,也让技术和制造事业群 TMG 里,负责制程开发的 TD 单位(Technology Development)的人员配置不足。
每家半导体厂的 TD 单位都是核心,更是处于战战竞竞的状况。按照原本计划步骤,英特尔的 14nm 制程开发好后,TD 主力团队就移到部分人力去 10nm 制程,以及部分人手去冲锋去 7nm 制程,只留下少数人力去维护 14nm 制程。
但因为 10nm 延宕,变成 14nm 要继续做 14nm+ 、14nm++ 、14nm+++ 等,导致可以分去开发 10nm 和 7nm 制程的人就更少了,如此一来更陷入一种“恶性循环”。
当时所有产品都挤在 14nm 制程上,导致 14nm 产能严重不足,这也是会加速晶圆代工业务结束的原因之一。
因为自家产能都不够了,大家都抢着用 14nm 制程,而 10nm 制程又出不来,代工客户要 14nm 产能没有,要 10nm 产能更不可能有,如此一来,怎么会有客户愿意下单给英特尔代工? 自然而然地,晶圆代工部门只好关门大吉。
这也种下连英特尔自己内部事业群都想要扩大委外代工的种子。
当时公司的 14nm 产能都给了主要产品如 CPU 和服务器等,那其他单位怎么办? 日子总还是要过,因此,越来越多人要求要使用外部产能。
像是手机芯片部门在英特尔内部还算是可以大声讲话的,且过去在英飞凌时,就一直在台积电投片,就要求能继续在台积电代工。久而久之,为了要求生存,越来越多部门要求要使用台积电的制程技术,以维持产品竞争力。
这样的循环一直到最后,连英特尔最核心的 CPU 产品,为了要维持竞争力,也开始考虑找台积电代工了,毕竟 AMD 也是逼很紧,大家压力都很大。
这次英特尔公开表示不排除找第三方委外代工的讯息,另有一个阴谋论的说法,认为英特尔只是利用该策略来趁机卡住 AMD 在台积电的产能而已,毕竟台积电的高端制程的产能非常紧,借机一石二鸟来“突击” AMD。
台积电“夜鹰计划”立功
很多人认为,英特尔的 10nm 与台积电的 10nm 不在同一个水平上,若是要比较,也要用台积电的 7nm 制程来比。因此,即使台积电的 10nm 比英特尔 10nm 更早量产,还不能说台积电的制程技术超前了英特尔。
不过,随着台积电一路从 10nm、7nm 制程一路领先量产,今年量产 5nm 制程,明年试产 3nm、后年量产 3nm,加上连英特尔都考虑要委由台积电来代工,台积电现在算是赢得实在。
台积电的高端制程技术一路成功追赶,要追溯至 2014 年提出的“夜鹰计划”,以 24 小时三班制轮班方式,不间断研发地加速 10nm 制程研发。
当时台积电为了让 10nm 如期量产,针对加入“夜鹰部队”的员工提出底薪加 30%、分红加 50% 的丰厚奖励,重赏之下必有勇夫,台积电 2016 年如期试产 10nm 制程。
不过,台积电后来没有继续“夜鹰计划”,因为轮夜班研发对菁英工程师是非常耗损的,被说成 10nm 制程是用一颗颗“新鲜的肝”换来的,所以才有“十万青年十万肝、一人一肝救台湾”的说法。这也让重视企业社会责任 CSR 的台积电在 10nm 达成任务后,没有继续该计划。
过去台积电、三星还不成气候之时,英特尔的研发真的是可以关起门来慢慢做,反正放眼半导体江湖是“天下无敌手”。
台积电这几年追上来,还用高端制程实力拉了 AMD 一把,这下子让英特尔紧张了,遭逢前所未有的警讯危机。但业界多数人仍是认为英特尔企业的“家底”太厚,趁此机会去除一些“陈年旧习”和一些确实早就该除掉的人,反而是好事,化危机为转机是迟早的事。

