大数跨境
0
0

【PLEXON 知识小课堂】Offline Sorter 中的主成分分析|科研人必看的干货

【PLEXON 知识小课堂】Offline Sorter 中的主成分分析|科研人必看的干货 HongKongPlexon
2025-04-11
1
导读:Offline Sorter(OFS)是目前业内最受认可和信赖的离线Spike Sorting软件,能够对采集到的多个神经元信息进行聚类和分选处理,是在体多通道电生理数据分析的重要一环。

PLEXON  知识小课堂

Offline Sorter 

中的

主成分分析



Offline Sorter Principal component analysis




Offline Sorter(OFS)是目前业内最受认可和信赖的离线Spike Sorting软件,能够对采集到的多个神经元信息进行聚类和分选处理,是在体多通道电生理数据分析的重要一环而在offline sorter使用的过程中,我们通常能够看到波形以“点”的形式显示在二维或者三维的空间中,而这依赖于主成分分析的运用,那么在今天这篇文章,我们将对主成分分析在offline sorter中的使用进行探讨。



1. 什么是主成分分析?


主成分(Principal component , PC)是大家在Offline Sorter中对unit进行sorting时遇到的一个术语。在基于特征簇的图中(图1),将前两个主成分作为X轴和Y轴进行绘图是一种常见的可视化方法。这个图也被称为特征空间而不是成分空间,因为波形的其他特征(如时间戳或非线性能量)也可以作为不同的X轴和Y轴进行绘图。



图1. 特征空间中相似的波形聚集成簇(cluster)中


主成分这个词可能比较难理解。然而,归根结底,主成分代表变异性。因此,在特征空间图中,使用主成分作为坐标轴的波形越接近,意味着变异性越小,也就是说波形特征越相似。


图1显示了Offline Sorter中波形(waveform)的多个视图。右上角的特征空间图默认使用主成分1 (PC1)和主成分2 (PC2)作为X轴和Y轴,每个波形在二维空间内以点的形式呈现。在这个图上点击并将鼠标悬停在一个点上,将在波形(Waveform)和时间线(Timeline)视图中显示对应的波形。在Offline Sorter中,每个unit都有不同的颜色,因此很容易看到特征空间图中的每个簇都包含形状相似的波形。例如:在图1中,unit a (黄色)与unit b (绿色)很好地分离,并且在波形和unit视图中它们的形状不同。Unit c (蓝色)位于两者之间,因为它同时具有unit a和unit b的特征。


Offline Sorter 



2. 主成分代表什么?


由于主成分分析的方法能够根据波形在特征空间中的位置来判断波形是否相似,因此这些在二维空间内聚集在一起的簇被用作许多自动sorting的方法(如K-means、Valley Seeking和T-Distribution E-M)的基础。然而,在特征空间中使用主成分来对波形进行比较和分组也会导致一些困惑。

由于特征空间中的位置代表了波形的相似性,主成分能告诉用户关于波形形状的信息吗?或者能提供关于波形中与其他波形显著不同的部分的信息吗?

Plexon公司经常收到来自用户的这类问题,他们难以理解图中基于特征的主成分代表什么。这些用户通常试图从波形在二维的特征空间图中的位置出发,反向确定波形的哪些特征“最重要”。这些问题凸显了对主成分代表什么的常见误解。


本文章的目的是帮助用户理解主成分能够说明什么,以及它不能说明的方面。

最简单的答案是:主成分代表波形形状之间的数学变异性(差异),这使得在特征空间图中可以根据相似性将波形分组在一起。然而,主成分并不直接说明波形的特征,如峰谷的幅值或峰宽。


下面我们来仔细讨论一下这个问题!

神经元数据具有高维性,或者说复杂性。在Plexon系统中,默认的波形长度为800us,以40kHz的采样率进行采集,也就是说每个波形由32个记录点组成。图2中由32个记录点组成的unit的平均波形用方块表示,每个记录通道可能有数万个波形。对于数千个形状各异的波形,仅基于波形可视化将它们分组到unit中可能很困难。例如,在图2中,仅根据未sorting的波形视图(右侧面板)将很难区分三个已sorting的unit。


图2. 具有32个点的波形


主成分分析(PCA)是提取主成分的数学函数,是一种降维方法,用于将数据提炼成可管理和信息丰富的片段。简单来说,PCA对高复杂度的波形进行优先级排序。那么,它优先处理哪些部分?答案是变化最大的部分,或者说差异最大的部分,所以说,在二维空间和三维空间内,默认都采用前两个主成分或者前三个主成分。


深入探讨PCA背后的数学原理不在本文章的讨论范围,但有几个关键点需要记住:PCA是一种线性代数函数,从矩阵数组中提取信息。在这种情况下,使用的数组是从波形数据计算出的协方差矩阵。关键要点是,PCA关注的是数学上的变异,而不是波形的幅度等特征。



3. 主成分输出的结果代表什么?


生成的主成分代表数据中方差最大的部分。方差是个纯数学定义,PCA不会告诉我们哪些数据点或特征解释了每个主成分所解释的方差。PCA输出的是特征值和特征向量。


PCA输出的第一个结果是特征向量,特征向量其实就是主成分,主成分代表数据中的方差。然而,使用特征向量一词,有利于我们更好的理解。


简而言之,特征向量是一个轴,或一个方向。这意味着主成分可以看做是坐标轴中的某个轴,用于测量该维度上数据的变异。这就像说我们可以建立一个坐标系,X轴是时间,Y轴是高度,在offline sorter中,X轴可以是主成分1,Y轴可以是主成分2。在这种情况下,主成分1是数据在一个方向上的方差,主成分2是数据在另一个方向上的方差。每个波形在每个主成分轴上都有一个位置。Offline Sorter计算8个主成分,因此,每个波形都可以被认为在主成分空间中具有一个8维的“位置”。


主成分的方差

重要的是,第一主成分代表尽可能多的方差,第二主成分代表最多的残差方差,依此类推。大多数变异性是由前几个成分解释的,这就是为什么Offline Sorter默认只用前两个或三个主成分进行绘图。


方差的幅度

PCA的第二个结果是特征值,它是该方差的幅度。换句话说,特征值表示该主成分解释了多少变异。这就是为什么我们把前几个主成分当做解释变异最重要的主成分。通常,特征值可以被量化,那我们就可以很容易的看到每个主成分解释了多少变异。在Offline Sorter中,特征值可以在PCA Stats view中找到(图3)。



图3. PCA统计——特征值



4. PCA Results view

这是什么?

特征向量在基于特征的二维坐标系中表示,特征值可以在PCA统计视图中找到。此外,Offline Sorter中还有一个PCA Results view(图4)。该图可能难以解释,因此请谨慎依赖这种可视化表示。


PCA Results view将32个记录点组成的波形投影到主成分上,这是对数据的数学处理。将波形投影到主成分上的目的是创建一个简化的波形数据可视化,突出显示高变异性的区域。请记住,PCA是一种降维技术,这一点在PCA结果图中得到了很好的展示,它将所有unit中的所有波形提炼成8条主成分线,每条线代表原始数据中某一部分的变异。


图中的每条线都有32个数据点,就像原始波形一样。每个点的值现在是PCA计算的变异表示,而不是我们记录到的真实的电压幅值。由于方差与波形形状直接相关,因此投影可能在某些方面类似于波形。例如,在图4中,对于第一主成分(黄色线),数据显示了在人们期望波形不同的位置(包括峰值幅度和超极化周期)存在变异。


不要混淆,该图不是原始波形或unit。尽管颜色相似,且PCA结果可能类似于波形形状,但该图并不直接代表波形或unit。同样重要的是要记住,与基于特征的图上的簇一样,PCA结果图也不会对波形数据的重要特征做出任何解释。



图4 – PCA Results view

在PCA Results view上,除第一主成分之外的其他主成分更难解释。请记住,每个主成分都是一个轴,这意味着它必须与前面的成分正交(成直角)。对于主成分2、3及更高主成分,必须考虑这个额外的因素。在更高的主成分中,PCA结果图将越来越不像波形形状。


最后,线的宽度或粗细表示特征值的大小。因此,代表第一主成分的线将始终是最粗的线。总的来说,由于正交主成分的复杂性增加,PCA Results view对于第一主成分最为有用。


总结来说


主成分可以告诉我们:

主成分可以在特征空间中绘制——具有相似变异性的波形将聚集在一起。

主成分代表数据中的变异性。

主成分不能告诉我们:
主成分不能确定波形的哪些特征是重要的。
主成分不能在unit之间统计比较相似性或不相似性。

在Offline Sorter中:
主成分(或特征向量)用于在特征空间中将相似的波形聚集在一起,以辅助sorting。


特征值(或数量)表示每个主成分所解释的方差大小,这有助于理解数据中的主要变异来源。PCA结果视图是波形在主成分上的投影,是变异性的可视化表示,但在解释此视图时应谨慎,尤其是对于高阶成分。


如果您对PCA背后的数学原理感兴趣,我推荐《A Beginner’s Guide to Eigenvectors, Eigenvalues, PCA, Covariance and Entropy | Pathmind》一文,这篇文章在不需要大量数学知识的情况下,很好地解释了矩阵数学。


只计算8个主成分,因为后续成分解释的变异性很少。大部分变异性包含在前2-3个成分中,很少有人考虑高阶成分。



原文链接:https://plexon.com//blog-post/principal-component-analysis-for-unit-sorting/



END




欢迎关注

B站视频号:

Plexon电生理


为更好的方便同学们对Plexon软件和PatchMaster软件的快速入门,现推出了一系列高质量的教学视频。



关注我们

ATTENTION US


联系我们

4000881922

http://www.hkplexon.com

info@plexon.com.hk




【声明】内容源于网络
0
0
HongKongPlexon
PLEXON是一家很早提供实时大规模神经元动作电位采集解决方案的公司。PLEXON的MAP系统也是我们第一款利用平行处理芯片实时采集多达128通道神经元放电的设备。目前该系统的用户遍及全球500多个实验室,是该领域使用最广泛的系统。
内容 94
粉丝 0
HongKongPlexon PLEXON是一家很早提供实时大规模神经元动作电位采集解决方案的公司。PLEXON的MAP系统也是我们第一款利用平行处理芯片实时采集多达128通道神经元放电的设备。目前该系统的用户遍及全球500多个实验室,是该领域使用最广泛的系统。
总阅读24
粉丝0
内容94