1. 概述与定位
- 标准归属: 10GBASE-KR 是 IEEE 802.3ap 项目(背板以太网)的一部分,最终被收录在 IEEE 802.3 标准的第 72 条款中。
- 核心功能: 它定义了如何在印刷电路板(PCB)的背板上实现 10 Gbps(万兆)的以太网传输。这里的“背板”指的是服务器、路由器、交换机等设备内部连接多个板卡(如线卡、交换卡、管理卡)的主板。
- 名称解析:
- 10G: 10 Gbps 速率。
- BASE: 基带传输,使用介质的全部带宽传输单一信号。
- K: 代表背板(Backplane)。
- R: 代表使用Reed-Solomon FEC(前向纠错)和接收端均衡。
具有可选的节能以太网(EEE)能力的10GBASE-KR PHY可以选择性地进入低功耗空闲(LPI)模式,以在低链路利用率期间节约能源。在XGMII上的“断言LPI”请求被编码在传输的符号中。在接收符号中检测LPI信号在XGMII表示为“断言LPI”。在XGMII检测到“断言LPI”后,一个节能的10GBASE-KR PHY继续传输一段预定义的时间,然后停止传输并取消传输功能以节省能量。PHY在此安静期间周期性地传输,以允许远程PHY刷新其接收器状态(例如,定时恢复、自适应滤波器系数),从而跟踪链路定时或底层信道特性的长期变化。如果在安静或刷新期间,正常的帧间帧在XGMII处恢复,则PHY将重新激活传输功能并启动传输。该传输将被远程PHY检测到,导致它也退出LPI模式。
72.4 Delay constraints
MAC控制暂停操作的可预测操作(第31条,附件31B)要求在网络中的传播延迟有一个上限。这意味着MAC、MAC控制子层和PHY实现者必须考虑延迟最大值,并且网络规划者和管理员必须考虑关于设备连接的延迟约束。描述整个系统延迟约束和比特时间和暂停量子的定义可以在69.3中找到。由10GBASE-KR PMD和介质所贡献的发射和接收延迟的总和应不超过1024位次。假设通过该介质的往返延迟为160位倍。
72.6 PMD functional specifications
72.6.5 PMD transmit disable function
如果支持EEE,则Global_PMD_transmit_disable函数是必填的,否则则是可选的。当支持此功能时,它应满足本子条款的要求。
a)当Global_PMD_transmit_disable变量设置为ONE时,该功能应关闭变送器,使其驱动恒定电平(即无过渡),且不超过表72-6中规定的最大差分峰值输出电压。
b)如果检测到PMD_fault(72.6.7),则PMD可以关闭电气变送器。
c)72.6.6中定义的回路不受Global_PMD_transmit_disable的影响。
d)对于EEE能力,在tx_mode设置在72.7.7.1.4规定的时间和电压水平内安静后,PMD_transmit_disable功能应关闭变送器。在tx_mode设置为72.7.1.4规定的时间和电压水平内的DATA或警报后,PMD_transmit_disable功能应打开变送器。如果实现了MDIO接口,则该函数应映射到45.2.1.8.7中指定的Global_PMD_transmit_disable位。
72.6.6 Loopback mode
设备的发射机和接收器应为10GBASE-KR PMD提供回路模式,作为对设备的测试功能。当选择环回模式时,传递给发射机的传输请求被直接分流到接收机,覆盖接收机在其附加链路上检测到的任何信号。注意,此位不会影响发射器的状态。实现环回模式的方法没有由本标准定义。
2. 在 OSI/RM 中的位置
10GBASE-KR 主要工作在物理层(PHY),更具体地说,它定义了 PMD(物理介质相关)子层 和用于背板的 基带介质。
- PMD 子层: 这是物理层的最底层,负责:
- 光/电转换(对于光介质)或信号驱动与接收(对于电气介质如背板)。
- 定义电气特性,如发送端的电压摆幅、接收端的灵敏度等。
- 对于 10GBASE-KR,PMD 就是安装在板卡上的 SerDes(串行器/解串器)芯片的电气接口。
- 基带介质: 指的就是背板本身。信号在不经过载波调制的情况下直接通过PCB上的铜走线传输。这意味着PMD需要处理由这些走线引起的所有信号完整性问题。
3. 技术细节详解
物理介质:背板(Baseband Medium)
- 介质类型: 印刷电路板(PCB)上的差分铜走线对。
- 信道结构: 一个完整的链路包括:
- 发送端板卡上的发射器(TX)芯片引脚。
- 发送端板卡的连接器。
- 背板PCB走线(这是最主要的介质部分)。
- 接收端板卡的连接器。
- 接收端板卡上的接收器(RX)芯片引脚。
- 信道挑战: 背板信道质量很差,相当于一个低通滤波器,会导致信号产生严重的损耗、抖动和码间干扰(ISI)。在10 GHz频率下,损耗可能高达 30-40 dB。因此,必须采用高级信号处理技术来补偿。
PMD 子层关键技术
为了克服恶劣的背板信道环境,10GBASE-KR 采用了一系列复杂的技术:
- 这是 PCS(物理编码子层)的功能,为PMD提供数据源。
- 它将 64 位数据块转换为 66 位编码块(增加2位同步头)。
- 这种编码效率(97%)比千兆以太网的 8B/10B(80%)更高。
- 在发送端,预先对信号的高频成分进行增强(Boost),以抵消信道在传输过程中对高频信号的优先衰减。
- 这相当于在源端“预失真”信号,使得信号经过信道后,在接收端能恢复到正确的形状。
- 这是 10GBASE-KR 的核心技术。接收端采用一个复杂的自适应均衡器,通常包括:
- 连续时间线性均衡(CTLE): 放大高频信号,补偿信道损耗。
- 判决反馈均衡(DFE): 非线性均衡器,能更有效地消除码间干扰(ISI),而不会放大噪声。
- 均衡器的设置不是固定的,而是通过链路训练(Link Training) 过程自适应调整的。
-
72.6.10.2 Training frame structure
控制通道使用差分曼彻斯特编码(DME)发出信号,信号速率等于10GBASE-KR信号速率的四分之一。由于每个DME符号包含两个DME转换位置,并且每个转换位置是4个10GBASE-KR UI,因此每8个10GBASE-KR UI传输一个控制信道位。
72.6.10.2.1 Frame marker
帧由32位模式分隔,十六进制0x FFFF 0000(先传输的),用10.3125 Gbd符号表示。这种模式不会出现在控制通道或训练模式中,因此可以作为训练框架开始的唯一指示器。
72.6.10.2.2 Control channel encoding
控制通道应采用曼彻斯特编码(DME)传输。
曼彻斯特差异编码规则如下:
a)在每个单元边界进行数据转换。
b)中间单元数据转换应作为逻辑信号。
c)没有中间单元格的数据转换应用于发出逻辑零的信号。
在给定的训练帧中,如果在控制信道的范围内检测到编码违规,则应忽略该帧的控制信道的内容。
数据单元格长度应为8 10GBASE-KR UI。因此,控制信道的总长度为256 10GBASE-KR UI。
72.6.10.2.3 Coefficient update field
系数更新字段将修正信息从本地接收器传送到链路伙伴传输均衡器。
该字段包括预设控制、初始化控制和三个传输均衡器水龙头的系数更新。
系数更新字段的格式应见表72-4所示。
首先传输发送的系数更新字段的单元15。
预设、初始化和系数更新均由接收机自适应过程设置。
接收机自适应过程所采用的算法超出了本标准的范围。
72.6.10.2.3.1 Preset 预设
发送预设控制以请求将系数设置为关闭均衡的状态。
接收时,前光标(k=-1)和后光标(k = +1)系数设置为零值,主系数(k = 0)设置为最大值。
只有在所有系数状态字段表示未更新时,才应首先发送预设控制,然后继续发送,直到所有系数的状态表示已更新或最大值。
此时,应将输出预设控制设置为零。
当主系数更新后,应返回最大状态。
当系数更新时,应返回光标前系数和/或光标后系数的最大状态,且零为其最大支持值。
当系数更新时,应返回光标前和/或光标后系数的更新状态,并支持在值零以上的附加设置。
在所有系数的传入状态消息恢复到未更新之前,不得发送对预设或初始化的新请求。预设不得与初始化或系数递增/递减请求一起发送。
72.6.10.2.3.2 Initialize
发送初始化控件以请求设置系数以将传输均衡器配置到其初始化状态。当接收到时,应设置the taps,使传输输出满足72.6.10.4.2中规定的条件。初始化控制只能在所有系数状态字段表示未更新时进行初始发送,然后继续发送,直到没有系数状态字段表示未更新。当系数更新完成后,应返回每个系数的更新状态。此时,应将输出初始化控制设置为零。
在所有系数的传入状态消息恢复到未更新之前,不得发送对预设或初始化的新请求。初始化不能结合系数增减请求或预设来发送。
72.6.10.2.3.3 Coefficient (k) update
每个系数k被分配一个描述请求更新的2位字段。定义了三种请求编码:增量、递减和保持。一个给定的水龙头的默认状态是保持的,这对应于系数没有变化。传输增量或减少编码以要求增加或减少相应的系数。变送器为响应系数更新请求而实施的变更量应满足表72-7和72.7.1.10的要求。应继续发送增量或递减请求,直到该点击的更新状态(在72.6.10.2.4.5中定义)表明已更新、最大值或最小值。此时,输出的点击请求应设置为保持。
在该点击恢复到未更新的传入状态消息之前,不得发送增加或减少的新请求。系数增减不得与初始化或预设一起发送。
k的有效范围是-1到+1,其中k = 0表示主抽头。系数更新的编码应如表72-4所示。
72.6.10.2.4 Status report field
72.6.10.2.4.4 Receiver ready
接收机准备位用于向链路伙伴信号本地接收机状态。当断言时,接收器准备位表示本地接收器已经结束训练并准备接收数据。当取消断言时,接收器准备位表示本地接收器正在请求继续训练。接收机准备位的格式如表72-5所示。
72.6.10.2.4.5 Coefficient (k) status
-
72.6.10.2.5 Coefficient update process
每个系数k都有一个关联的系数更新状态图,该状态图控制系数的更新并生成抽头更新状态字段。
给定水龙头的默认状态为未更新。只有当水龙头状态未更新时,增量或递减请求才会被执行。当接收到增量或递减请求时,系统会将状态报告为已更新、最大值或最小值。若接收到的增量请求使水龙头数值达到最大限值,或数值已处于该限值,则报告最大值;若接收到的递减请求使水龙头数值达到最小限值,或数值已处于该限值,则报告最小值。
报告更新、最大或最小状态后,系统将继续报告该状态,直至收到保持请求,之后状态将恢复为未更新。
系数更新过程响应如图72-6所示的状态图中规定的系数请求。
72.6.10.2.6 Training pattern
训练模式应为512八位模式,包括11阶(PRBS11)生成器输出的4094位,然后跟着两个零。PRBS11模式生成器应产生与图72-3中所示的实现相同的结果。这实现了方程式(72-1)中所示的生成器多项式。
- 在物理层增加额外的纠错码(RS(528, 514) code)。
- 即使线路上存在一些误码,接收端也可以通过FEC算法自动检测和纠正这些错误,从而显著降低最终的误码率(BER),从 10^{-12} 提升到 10^{-15} 甚至更低。
- FEC 的代价是增加了少量的延迟和开销。
- 这是 10GBASE-KR 区别于许多其他以太网物理层的一个关键特性。
- 在链路初始化时,收发双方会交换一个特殊的训练帧序列。
- 通过这个过程,接收端会指导发送端调整其发送参数(如预加重强度),同时接收端也会优化自己的均衡器参数。
- 目的: 使链路适应特定的背板特性、连接器差异和环境变化(如温度、电压),确保链路的最高可靠性和稳定性。
4、电气特性
什么是Transition time?
根据72.7.1.11定义的上升边缘过渡时间应为20%和80%,上升和下降边缘过渡时间应在24 ps和47 ps之间。测量采用52.9.1.2中定义的方波测试模式进行,不进行均衡,至少连续运行8次。通过确定表45-71和45.2.1.91.3中定义的预设控制,可以禁用传输均衡。
通过72.6.10中定义的协议,对发射器均衡器的状态或通过管理进行控制。由于系数更新请求而导致的变送器输出波形的变化应满足表72-7中规定的要求。表72-7中的系数更新请求之后,系数更新等于所有的taps。在所有taps的系数状态报告为未更新后,应验证结果。
对于任何系数更新,v1、v2和v3的变化幅度应在5 mV以内。当对给定的抽头应用了足够的增量或递减更新时,它将达到由系数范围或对最小稳态或最大峰值电压的限制所控制的最大或最小限制,并相应地报告系数状态。对于表中表示的所有极限情况,变送器输出波形应满足表72-8的要求。实现c(-1)或c (1)系数值大于0或小于Rpre(min)和Rpst(min)定义的最小值是可选的。通过首先断言表45-158和45.2.1.91中定义的预设控制,然后根据测试的要求操作其他系数,可以禁用一个系数。
In addition:
a) The quantities v2 and v5 shall not exceed 40 mV peak-to-peak.
b) The positive and negative voltages shall match such that each of the quantities (v1 + v4)/v1, (v2 + v5)/v2, and (v3 + v6)/v3 does not exceed 0.05.
c) The quantity v2 shall be greater than or equal to 40 mV.
d) Any coefficient update equal to decrement applied to any tap that would result in v2 less than 40 mV shall return a coefficient status value minimum.
e) Any coefficient update equal to decrement that would result in a violation of 72.7.1.4 shall return a coefficient status value minimum for that coefficient.
f) Any coefficient update equal to increment that would result in a violation of 72.7.1.4 shall return a coefficient status value maximum for that coefficient.
72.6.10.4 State diagrams
帧锁定状态图确定PMD控制功能何时检测到接收数据流中的帧边界。
72.7 10GBASE-KR electrical characteristics
72.7.1.2 Test fixture impedance
The 10GBASE-KR signaling speed shall be 10.3125 GBd ± 100 ppm.
差分输出电压通过72.7.1.10中规定的变送器输出波形要求进行约束。对于1010模式,无论均衡设置如何,峰值差分输出电压都应小于1200 mV。禁用时变送器输出电压应小于30 mV。差分输出电压测试模式应由不少于8个交替极性符号组成。
对于EEE能力,变送器的差峰峰输出电压应在tx_mode设置为500 ns的安静时间内小于30 mV,并在tx_mode设置为安静时保持不变。此外,在tx_mode设置为警报的500 ns内,变送器的差峰峰输出电压应大于720 mV。在tx_mode设置为DATA后,变送器输出应在5范围内完全兼容。在LPI模式下,共模应保持在LPI前值的± 150 mV范围内。
72.7.1.5 Differential output return loss
72.7.1.6 Common-mode output return loss
72.7.2 Receiver characteristics
72.7.2.3交流耦合
10GBASE-KR接收器应通过交流耦合到背板上,以允许各种10 Gb/s组件之间的最大互操作性。除非另有明确说明,否则交流耦合被认为是接收器的一部分。需要注意的是,在实际实现中可能有各种交流耦合的方法。注意:建议将耦合电容器的最大值限制在100 nF。这将限制流入接收器的涌入电流,当反复连接到具有较高电压水平的传输模块时,可能会损坏接收器电路。
5.10GBASE-KR 与 10GBASE-KX4 的区别
6. 应用场景
10GBASE-KR 主要用于需要高带宽、高密度板间互连的场景:
- 高端网络交换机/路由器: 线卡与交换卡之间的数据交换。
- 高性能计算(HPC)集群: 计算节点板卡与交换背板的连接。
- 电信级服务器: ATCA(Advanced Telecommunications Computing Architecture)架构中的板卡通信。
- 存储区域网络(SAN): 存储控制器与扩展柜之间的连接。
总结
IEEE 802.3 Clause 72 10GBASE-KR 是一项关键的背板以太网技术,它通过先进的PMD子层技术(如发送预加重、接收端自适应均衡、Reed-Solomon FEC)和链路训练机制,成功地在损耗巨大的PCB背板走线上实现了稳定可靠的10Gbps串行传输。它是现代高性能网络设备和数据中心基础设施实现高带宽板间互连的基石技术之一。

