大数跨境

芯航|器官芯片前沿论文(一):基于深度学习的器官芯片应用最新进展

芯航|器官芯片前沿论文(一):基于深度学习的器官芯片应用最新进展 芯航资本
2022-05-11
3
导读:AI深度学习算法可提升器官芯片的智能化水平,挖掘其在药物开发、疾病建模和个性化医疗方面的巨大潜力。

[编者按]器官芯片(Organs-on-chips,简称 OoCs)是近年来诞生的一项变革性生物医学技术。它是通过干细胞、生物材料、纳米加工等前沿技术的交叉集成,在体外构建器官微生理系统,从而模拟人体器官的生理结构和生理功能,在医学研究、疾病模拟、新药研发、毒性预测、个性化治疗等方面具有广泛的应用潜力。2016年,器官芯片技术被达沃斯世界经济论坛列为“十大新兴科技”之一,被视为未来人类医学进步的重要推动力。


为此,芯航编译了两篇器官芯片领域的前沿论文,供读者了解其最新发展动态。以下为第一篇《基于深度学习的器官芯片概述》。


基于微流控技术的器官芯片(OoC)技术在生物医学和化学研究领域发展迅猛,已成为最先进、最有前景的体外模型之一。OoC 的微型化、受激组织机械力和微环境为生物医学应用提供了独特的特性。然而,OoC 系统高度并行化所产生的大量数据已经远远超出了具有生物医学背景的研究人员人工分析的范围。深度学习是机器学习领域的一个新兴研究领域,其可以自动挖掘“大数据”的固有特征和规律,在计算机视觉、语音识别和自然语言处理方面的应用已取得了显著的成果。将深度学习集成至 OoC 是一个新兴领域,在药物开发、疾病建模和个性化医疗方面具有巨大潜力。本综述简要介绍了微流控技术和深度学习的基本概念和机制,并对两者的成功集成进行了总结。然后,我们分析了 OoC 与深度学习相结合在图像数字化、数据分析和自动化方面的应用情况。最后,讨论了当前应用中面临的问题,并提出了进一步加强该集成的未来前景与建议。


01

引   言

生物学研究中使用最广泛的实验模型是基于细胞和动物的模型;然而,这两种模型均存在许多局限性。传统的基于细胞的模型缺乏一些必要特征,例如复杂的多重培养、生理微环境和组织机械力。动物模型虽然在许多生物学研究中被视为当前的金标准,但存在成本高、伦理问题、低通量和种间差异等问题,这极大限制了药物开发和其他生物学研究的进展。

基于微流控的 OoC 技术旨在填补传统二维(2D)细胞培养和动物模型之间的空白,并逐渐取代动物研究。作为微流控技术不断发展的产物,OoC 将微流控技术与细胞生物学相结合;可忠实模拟体内靶器官的生理微环境。这些新颖的体外生物模型可以复制疾病的局部特征,并控制细胞存活的环境参数,从而成为生物研究领域高性价比、高通量平台。聚二甲基硅氧烷(PDMS)和聚甲基丙烯酸甲酯(PMMA)是制造 OoC 装置最常用的材料。由于这些材料的透明性及其与荧光显微镜的高度兼容性,OoC 的应用通常会生成大量图像,从而产生大量基于图像的数据。传统上通过人工方法积累和处理这些数据,但通常效率较低。


图1:深度学习与器官芯片(OoC)的集成

(图片使用 http://BioRender.com  创建)

深度学习已经应用于 OoC 中的装置设计、实时监控和图像处理。未来可能会进一步应用于细胞器跟踪、机械力模拟、药物筛选、罕见疾病诊断和人体芯片调控


自动化智能数据分析系统的使用将进一步促进 OoC 在各种生物医学应用中的发展。深度学习是人工智能(AI)中最具代表性的研究领域。将深度学习应用于 OoC,为探索和分析 OoC 方法生成的大量基于图像的数据提供了强大的工具,从而提高了 OoC 的自动化水平。Riordon 等人综述了深度学习与微流控的集成。然而在 OoC 领域,迄今为止尚无关注这一新概念的综述。因此,及时、全面地总结深度学习在 OoC 研究中的应用将促进该技术的发展,并促进这两个领域的研究。

本综述深入讨论了深度学习与 OoC 的集成(图1)。在介绍了 OoC 和深度学习的基本概念之后,我们综述了深度学习作为一种多功能数据分析工具在生物医学中的应用,包括细胞识别、定位、跟踪和图像分割。最后,我们讨论了在 OoC 领域应用和整合深度学习的未来方向。


02

OoC 技术的出现


复制人体生理系统对于制药行业预测药效、药代动力学和毒性极其重要。动物模型目前是许多生物学研究的金标准,可以提供最准确的预测。然而,由于相关成本高、通量低以及伦理问题,动物模型的应用仅限于药物发现的早期阶段。此外,种间差异是动物模型与人类之间不可逾越的鸿沟;因此,一些疾病模型和药物疗效研究的实验结果与人类中的实验结果存在偏差。对于体外模型,大多数生物学研究依赖于二维(2D)细胞培养。尽管该模型具有一定的价值,但其无法充分重建体内细胞微环境或模拟人体器官的复杂生理功能。为解决该问题,出现了三维(3D)细胞培养模型,与传统的 2D 细胞培养相比,该模型的部分功能有一定增强,例如改善分化功能的表达、组织结构、信号采集和药物反应敏感性。然而,即使是最有效的 3D 模型也无法完美再现复杂的细胞间相互作用、不同类型细胞的空间布局以及人体器官的组织机械力。


最近在微流控系统和细胞生物学方面的研究创造了全新的工程微生理系统 OoC。这些体外模型可提供组织机械力和可控微环境,可以重建靶器官/组织的基本特征。因此,OoC 的引入填补了过于简单的 2D 细胞培养和昂贵的动物模型之间的差距,提供了一个高效节能的生物研究平台(图2)。


 2.1 微流控技术 


微流控技术是具有特定形态和位置结构的微型系统。其宽度和高度范围均在 100nm 和 100μm 之间。微流控系统中的反应时间比传统仪器中的反应时间短得多,因为小系统可迅速扩散分子。微流控技术的实现与光刻和喷墨打印技术的快速发展密不可分。


图2:OoC 技术的出现在动物模型

与传统体外模型之间提供了强有力的联系

其考虑了生理相关性和复杂性以及通量与重现性

(图片由 http://BioRender.com  创建)


同时,研究人员设计了能够控制和操纵流体流动的泵和阀门。因此,微流控系统具有操作速度快、体积小的优点,可以在微观尺度上操纵流体,实现生理流体剪切和脉动流型。与传统的流量控制平台相比,小型微流控系统使用的试剂更少,因此是高通量筛选的完美工具。在过去二十年中,微流控已成功用于各种生物学应用,如快速细胞分选、细胞生物化学分析、生物材料筛选和 OoC。


 2.2 OoC 技术 


由于微流控技术的固有特性,如小型化、高度受控的流动系统和灵活的装置设计,微流控技术、生物材料和细胞生物学的集成催生了先进的体外 OoC 系统(图3)。与传统的体外细胞模型相比,OoC 可以精确控制化学浓度梯度、组织机械力、细胞空间构型培养、多细胞共培养和器官间相互作用等参数,以复制人体器官的复杂结构、微环境和生理功能。此外,基于 OoC 的生理屏障模型可准确模拟化合物在体内的传递和渗透。近年来,OoC 的精度大幅提高,允许在单细胞上进行分析,并实现高通量,在单细胞分辨率下同时进行数千次定量分析。

经过近年来的快速发展,研究人员已经在 OoC 中复制了几个人体器官(图4)。Ho 等人在 PDMS 制成的圆形微流控芯片上图案化肝细胞和上皮细胞,成功地模拟了肝小叶的结构。Huh 等人设计了一种双层肺芯片,利用真空泵使 PDMS 膜变形,以模拟呼吸时肺泡壁的膨胀和收缩。该成果被认为是有关 OoC 技术的里程碑式研究。Kim 等人利用类似的设计来模拟人类肠蠕动时的扩张。Jang 等人通过在双层 OoC 中引入流体剪切来复制肾脏的近端肾小管结构。Ren 等人还利用两个平行微柱阵列构建了毛细血管内皮屏障,以精确模拟心肌组织的结构和功能。通过将聚合物化学性质和 OoC 技术相结合,我们最近报告了一种模拟血脑屏障(BBB)功能的血脑屏障芯片。我们成功评价了小分子药物的渗透性,并监测了内皮中纳米材料的内吞和转胞吞作用。此外,研究机构和制药公司之间的合作促使 OoC 进入实践阶段。肾脏芯片已成功应用于药物筛选。此外,强生公司计划使用 Emulate 研发的人血栓仿真 OoC 进行药物试验,并使用肝脏芯片来测试药物的肝毒性。

根据以上讨论,认为人体主要器官 OoC 已经研发完成;针对其他研究较少的器官和组织,已研发出越来越多的器官模型 ,如肌肉模型、骨骼模型、组织模型、乳腺模型、皮肤模型等。


03

深度学习


近年来,随着图形处理单元(GPU)计算性能的增强和大数据采集能力的提高,深度学习已使许多行业设立了最先进的基准,并已成为工程应用的首选智能技术。

深度学习已广泛用于众多领域,如自然语言处理、语音识别和计算机视觉。根据当今计算机科学领域3个热门主题(即 AI、机器学习和深度学习)之间的关系,我们对深度学习的发展背景进行了深入分析(图5)。机器学习是实现 AI 的常用技术手段,深度学习是一种机器学习算法。AI 用于模仿人类思维、感知环境,并采取行动实现目标。机器学习是指根据大量的历史数据选择最合适的算法,使机器能够学习固有的常规信息,从而有效地解决实际问题。机器学习领域存在大量算法,其中应用最广泛的是基于神经网络的深度学习。基于神经网络的深度学习行为可模仿人脑的许多特征;通过模拟大脑的结构和特征,还包含大脑的一些基本功能。


图3:微流控技术、生物材料与细胞生物学的集成

催生了先进的体外 OoC 系统

从人体中提取细胞(2),将其置于可灌注微流控装置(3)中以制备 OoC(4)。多个 OoC 连接在一起形成人体芯片系统(5),最终将忠实地复制人体的关键功能,因此在药物发现和病理研究中具有巨大的应用潜力(图片由 http://BioRender.com 创建)。



图4:OoC 的一些成功应用及其相应功能
(图片由 http://BioRender.com 创建)


1943年,McCulloch 和 Pitts 联合提出了 McCulloch-Pitts(M-P)模型(图6(a))并开发出了神经网络理论,为机器学习的发展奠定了基础。1957年,神经网络首次被开发出来,Rosenblatt 等人建立了单层感知机的概念(图6(b)),成为第一个神经网络模型。该模型为简单神经网络,将数据线性地分为两类。输入是实例的特征向量,输出是实例的类别,使用+1和-1的二进制值。然而,直到1969年,Minskey 和 Papert 才证明感知机无法面对类似于 XOR 的线性不可分割问题;该证明促进了机器学习十年研究期间的发展。

1986年,作为深度学习的创始人,Rumelhart 等人提出了著名的反向传播(BP)算法(图6(c)),该算法可以解决 XOR 等线性不可分割问题,从而推动了第二代神经网络的研究浪潮。训练网络时,实际值和参考值之间的误差变得明显。然后他们使用梯度下降法尽可能地减少这种误差。正向传播后,计算出误差相对于模型参数的梯度。该梯度通过梯度下降法反向传播,以修改不同神经元之间突触连接的权重,逐渐找到权重和偏差的最佳组合,从而将误差降至最低,提高模型的性能。


图5:AI、机器学习和深度学习之间的视觉关系。


图6:深度学习发展背景的深入分析

(a) 生物神经元和 M-P 模型。为了简化模型并便于表达,该模型忽略了生物学中的复杂因素。(b) 单层感知机。(c) 反向传播算法。(d) 卷积神经网络。


图7:一些典型的深度学习网络
(a) LeNet 的架构。每个正方形均为一个特征图,每组正方形的权重被限制为等同。(b) DBN 的架构。DBN 由几个隐藏层和一个可见层组成,各层之间有连接,但各层单元之间无连接。对隐藏层进行训练,以捕获视觉层中显示的数据的相关性。(c) AlexNet 的架构。其与 LeNet 类似,但用一些卷积(Conv)层代替了大卷积,这意味着其比 LeNet 更深。除此之外,其使用 ReLU 作为激活函数,并且使用的数据量远超过 LeNet。


BP 已成为多层感知机训练中最常用的优化算法。此外,另一位深度学习先驱,Lecun 等人提出了卷积神经网络(CNN),成功实现了手写数字识别。这是世界上第一个 CNN 架构,即著名的 LeNet 网络(图7(a))。CNN 架构通常包括几个卷积层,池化层和完全连接(FC)层紧随其后(图6(d))。在卷积层中,前一层的特征图和左上角的过滤器创建一个卷积,将相应的数字相乘,然后相加。过滤器平滑滑动,直到计算出所有特征;因此,输出形成了该层的特征图。池化层位于两个卷积层之间,有助于聚合特征和减少维度。它将输入数据划分为不同的区域,并通过池化操作降低每个区域的图像分辨率。FC 层的主要目的是将特征逐个连接到标记空间。其所有的连接均与前一层的连接紧密相连,从而将多维输出转化为一维向量并实现分类。然而,由于梯度的消失、训练样本数量的限制、计算能力的缺乏,以及浅层学习模型的引入,如支持向量机(SVM)、逻辑回归(LR)、决策树和朴素贝叶斯模型(NBM),神经网络尚未得到广泛应用和推广,该领域研究也减少了。

2006年,Hinton 等人提出了深度信念网络(DBN)(图7(b)),有效缩短了深度神经网络的训练时间,缓解了 BP 算法造成的梯度消失问题。此外,还构造了新激活函数线性整流函数(ReLU)。实验表明,使用 ReLU 可以抑制梯度消失问题。

2012年,深度学习成为热门研究课题。在 ImageNet 大规模视觉识别挑战赛(ILSVRC)中,Krizhevsky 等人构建了一个多层卷积神经网络 AlexNet(图7(c)),实现了图像分类错误率从之前最低的26%大幅降低到15%。这一创纪录的表现震惊了整个行业,并再次激发了人们对神经网络的研究兴趣。众多基于深度 CNN 架构的模型不断涌现,并取得了许多令人印象深刻的成果。有代表性的 CNN 架构包括 VGGNet、Google-Net 和 ResNet。

除了 CNN,近年来深度学习领域的许多其他研究分支也得到了发展,包括以循环神经网络(RNN)和 transformers 为代表的序列预测,以生成对抗网络(GAN)为代表的图像生成,以 Faster R-CNN、YOLO 为代表的目标检测,以及以 U-Net 和 DeepLab 为代表的语义分割。

近年来,深度学习已被各生产商成功应用于商业应用程序;这些应用程序包括谷歌翻译、苹果的语音工具 Siri、微软的 Cortana 个人语音助手和蚂蚁金服的微笑支付。最重要的是,深度学习可能有助于缓解2019冠状病毒病(COVID-19)等疾病,该疾病在过去两年中导致了全球大流行。深度学习技术有可能在识别许多国家的流行病学特征方面发挥巨大作用,并能够探索流行病的发展趋势,从而为制定控制措施提供依据。此外,越来越多行业的研究团队正在将深度学习纳入研究和商业应用的探索中,例如医疗诊断、流行病跟踪和预测、工业智能制造、自动驾驶和虚拟现实。


04

OoC 和深度学习的集成


OoC 和深度学习分别是生物医学工程和人工智能的前沿学科。在本节中,我们首先介绍了深度学习在微流控领域的应用,然后将其扩展到 OoC(表1)。由于目前尚未对这两个学科的结合进行广泛探讨,因此我们还就深度学习在 OoC 以下方面的应用进行了展望:预测、目标识别、图像分割和跟踪。


表1:微流控技术中的深度学习
和 OoC 中的深度学习的不同应用总结


 4.1 微流控技术中的深度学习 


深度学习的发展使微流控研究取得了巨大的进展,并催生了具有广泛功能的新一代微流控平台。此外,深度学习在微流控中的应用使研究人员能够观察到过去难以捕捉到的现象。我们将这些应用分为两类:装置参数和图像。


4.1.1 装置参数中的深度学习


微流控装置在乳剂生产中的应用具有一些优势,如试剂减少、生产的乳剂分子量分布范围窄以及高附加值产品的生成。所有参数(即流速、粘度、两相表面张力和微通道直径)的改变和分组均可影响 T 型连接的微滴。Mahdi 等人将这些无量纲参数作为神经网络的输入信号。在隐藏层进行循环训练后,确定神经元的数量和互连性。最后,该网络输出微滴的无量纲长度 Ld 和结点宽度 w 的预测结果(图8(a))。

微流控中使用的软传感器由高度可变形的聚合物组成。这些传感器可应用于弹性驱动器、软性可穿戴机器人装置和软性机器人抓手。然而,与传统的传感器相比,微流控软传感器的主要缺点是反应的非线性和滞后性。Han 等人使用层级信号水平的循环网络来表征微流控软传感器,该传感器可以识别压力和刺激的位置(图8 (b))。在充满液态金属的微流控通道中,模拟电压随着压力和通道的位置而变化。最初,该网络通过三个隐藏层来收集时间序列信息,并将顺序输入数据转化为一种表达。然后,该网络会确定传感器被按下的位置。最后,压力评估网络会预测传感器输出所对应的压力大小。获得的时间序列相关数据被输入到 RNN 中进行模型训练。该模型可以确定沿通道的压力和刺激的位置。

微流控芯片的设计和流体建模需要大量的计算和水力学知识,这对具有生物医学背景的研究人员来说可能是个障碍。最常见的方法是在大量的设计方案中进行大量的交互式和直观的选择,这是一项费时费力的工作。Stoecklein 等人利用深度学习回答了“什么样的几何形状能产生理想的微流控形状?”的问题(图8 (c))。CNN 架构使用测试数据集中的目标流动形状并预测了流动形状。与原始网络相比,神经网络可以独立选择最佳方案。对这种类型的数据进行智能取样可以极大地提高性能,并能在训练范围之外进行有效预测。


4.1.2 图像中的深度学习


识别细胞图像的算法规则大多基于数学原理和统计学定理,是传统机器学习的一部分。例如,外周血涂片图像由三种类型的细胞组成:红细胞、白细胞和血小板。后两者在形态上与红细胞不同。基于标记控制的算法已被用于分离显微镜图像中的白细胞核。此外,还有形态学和阈值选取技术、聚类分割算法和基于规则的方法、数学形态学和粒度测量法以及灰度阈值法。这些也能实现细胞识别。传统机器学习与微流控技术的集成已经实现了单细胞脂质筛选和细胞计数。

然而,由于微流控技术的高度平行运行所产生的多种类型数据的复杂性,传统的机器学习已不足以满足研究人员的要求。由于技术的进步,适合应用深度学习,这是一种以高效率处理大量数据的大众方法。与传统的机器学习相比,深度学习在微流控领域的集成优势非常明显:其可用于训练复杂的神经网络,获得数据的内部特征,提高使用大型高维数据集的实验效率。

深度学习已被用于识别和分类使用 RNN 架构的微流控通道中的移动细胞。将通过多种成像方式获得的细胞特征向量(如圆度、周长和主轴长度)输入网络,并确定诊断细胞的类别(如白细胞和结肠癌细胞)。Singh 等人使用上述方法实现了无标签细胞的分类。Chen 等人利用定量延时显微镜获得了丰富的细胞特征数据,并利用深度学习方法实现了细胞分类。这种方法的准确度超过了传统机器学习的准确度。San-Miguel 等人使用微流控技术采集秀丽隐杆线虫阵列的定位,并对其突触点模式进行了成像。这项工作通过将测量数据输入 RNN 架构来识别突变之间的微小差异,揭示了其隐藏的遗传差异。


图8:装置参数的深度学习

(a) 微流控 T 型连接中微滴的形成机制。分散相垂直于横向通道。两个注射泵供应并控制两种液体。以下神经网络由隐藏层的10个神经元组成。(b) 分层的信号级循环网络,可同时学习预测压力和位置。(c) 训练好的深度学习网络的工作流程。


大多数现有的测量方法不适合样品量较小的微流控设备,因为需要在培养过程中测量通道内的细菌水平。因此,Kim 等人开发了一种基于图像的方法来评估微流控通道中细菌的生长状态。在该研究中,细菌在微流控装置中进行培养,液体和琼脂凝胶介质置于该装置的两个单独通道中。采集了延时图像,并使用快速傅里叶变换(FFT)来检测图像的可变频率。实验获得的图像被用作 CNN 架构的输入信号(图9 (a))。使用该模型,成功获得了铜绿假单胞菌的水平,并对微流控通道中的细菌生长进行了量化。

此外,当需要实现复杂的图像输入和时间信息时,可组合使用 CNN 和 RNN 架构。例如,细胞分化可改变原始干细胞的细胞内分子特性,导致其形态和运动能力改变。Buggenthin 等人将 CNN 与 RNN 架构相结合,在识别造血谱系时预测单细胞谱系(图9 (b))。该模型首先使用 CNN 架构来提取亮视野图像下干细胞的局部抽象特征,输出矢量表明这些特征是否与某些细胞补丁类似。然后,将输出矢量输入具有双向长短时记忆网络(LSTM)架构的 RNN 中,以模拟细胞动力学。分析了视频中细胞的时间信息的影响,并将个体细胞归类为属于某一谱系。与 CNN 相比,这种混合方法提高了模型的预测能力;此外,还可预测初级造血细胞的谱系选择。使用类似的方法,也有可能识别细胞的形状并分析运动形态。

图9:图像中的深度学习

(a) CNN 结构可估计微流控通道中的细菌生长状况。(b) CNN 架构与 RNN 架构相结合,可利用单细胞轨迹的时间信息来自动选择干细胞的后代谱系。


 4.2 OoC 中的深度学习 

在本节中,我们将讨论深度学习在 OoC 中的各种应用。通过详细讨论每种类型的应用实例,说明深度学习与 OoC 集成的作用和多功能性。

树突状细胞通过吸收肿瘤抗原并将其呈现给 T 细胞,可在识别肿瘤细胞方面发挥关键作用。因此,免疫治疗的有效性在很大程度上依赖于肿瘤和树突状细胞在肿瘤微环境中的相互作用,以诱导有效的抗肿瘤反应[93]。Parlato 等人通过将 OoC 与先进显微镜技术相结合,重建了一个相互连接的三维免疫细胞-肿瘤生态系统(图10 (a))。该装置由一个中央免疫室组成,其通过一个微通道阵列与肿瘤室相互连接。在该肿瘤芯片设备上,使用 Cell Hunter(一种基于深度学习的无监督细胞跟踪分析算法)量化代表树突状细胞迁移能力的数量、速度、位移和其他参数。在该系统的支持下,评估了树突状细胞向肿瘤细胞的有效移动情况。
当免疫细胞探索已知的环境(如探针)时,通过分析环境可获得有关人外周血单核细胞 (PBMC) 接近肿瘤细胞方式的信息。

为监测 PBMC 与肿瘤细胞之间的相互作用,Biselli 等人利用 OoC 技术,重建了肿瘤芯片,将 PBMC 与 HER2+ 肿瘤细胞共培养(图10 (b))。通过定制的算法,作者证明延时显微镜检查的实验条件可直接影响细胞跟踪算法的准确度。基于同一芯片,Comes 等人进一步研究了时间和空间分辨率对 OoC 实验结果可靠性的影响(图10(c))。使用该方法,作者成功获得了不同治疗条件下的细胞运动特征,并揭示了靶向治疗的有效性。该研究还证明了 OoC 作为生物学与计算机科学之间的桥梁在高内涵图像数据提取中的重要作用。

癌症研究领域的一个重大挑战是肿瘤微环境的复杂性增加。与上述例子相关,前文所述 Nguyen 等人的研究小组在肿瘤芯片中构建了更复杂的 HER2+ 乳腺肿瘤微环境(图11 (a))。

图10:OoC 中的深度学习

(a) 用于实时监测细胞相互作用的装置三维示意图。(b) 肿瘤芯片的总体方案,包括6个用于更换培养基的储藏库和4个用于细胞培养的腔室。(c) 随机粒子相互作用模型的定义。细胞之间的物理相互作用是通过排斥-吸引交流进行的。对于免疫细胞与癌症的相互作用,他们在目标细胞附近施加了一个吸引力。


除 HER2+ 乳腺癌细胞外,还共同培养了内皮细胞和成纤维细胞,以更好地复制肿瘤组织的微环境。与先前研究类似,使用了免疫细胞,并使用 Cell Hunter 跟踪 OoC 中细胞之间的相互作用。这种深度学习与 OoC 的集成可实现模型中肿瘤细胞复杂动力学的可视化和量化。结果表明,肿瘤芯片是研究免疫细胞与肿瘤微环境之间相互作用以及免疫细胞-肿瘤生态系统对药物治疗反应的强大平台。

该研究小组进一步优化了算法,并开发了一种新型深度学习工具,称为深度跟踪。第一步是获得在 OoC 平台上移动的细胞的视频。视频显示,对一系列状况下细胞移动的轨迹图像进行了采集。对于人类专家来说,通过该步骤采集的细胞轨迹比采用多通道时间序列方法采集的轨迹更明显。第二步是利用预先训练的 CNN 架构 AlexNet,根据每个实验的可视化图谱对细胞轨迹进行分类。作者在两种类型的肿瘤芯片中对深度跟踪进行了测试(图11(b))。通过使用深度跟踪,发现加入免疫治疗药物曲妥珠单抗可增强癌症-免疫细胞相互作用。该模型准确性较高,证明了深度跟踪的通用性。通常,在深度学习中需要手动采集信息;然而,并未根据循环实验对深度跟踪算法中的参数进行调整。因此,我们认为,通过在系统中添加专家手动调整的关键参数,将会提高深度跟踪的准确性。

物质和能量代谢通过骨骼肌进行。由于肌肉的动态特征,在体外模拟生理状态是非常重要的。Jena 等人在一个可拉伸 3D 平台中培养了原代人骨骼肌细胞,以生成人体肌肉芯片。在这项研究中,作者使用了具有 LSTM 内存块的 RNN 架构以及图11(c)所示的 CNN 架构,其中使用的算法比深度跟踪更加复杂。根据通过 RNN 架构所预测的图像的时间序列,作者推断了细胞位置和形态的差异。他们将这些图像应用于进一步的 CNN 架构中。接着,他们利用这种深度学习框架,基于细胞随时间变化的静态和动态图像,成功确定了生化标记物。这类经训练的 CNN 架构也可用于判断肌肉细胞的生理状态、收缩类型和性能,而无需进行昂贵复杂的生化检测。此外,这种肌肉芯片还可为早期诊断和个性化医疗发展方法提供参考。

图11:OoC 的深度学习

(a) 肿瘤芯片方法。中央血管腔室由单层内皮细胞(粉色)组成,侧室填充有三维胶原水凝胶(灰色),其中嵌入了癌细胞(绿色)、免疫细胞(蓝色)和 CAFs(红色)。(b) 提出方法的示意图。(c) 将示差膨胀显微镜(DExM)放入有 LSTM 内存块的 RNN 架构,以预测肌肉细胞的形态,并获得时间 DExM 图像。然后,通过 CNN 架构,使用这些图像来预测细胞功能。


 4.3 深度学习在 OoC 中的关键应用 

通过深度学习和微流控技术成功集成的实例,可确定多个关键视角(图12)。在项目准备阶段,深度学习可应用于 OoC 的器械设计和材料选择,使 OoC 更适合于特定应用。此外,由于多细胞培养在 OoC 中的日益普及,深度学习也可用于细胞群的稳健判别。

图12:深度学习在 OoC 中的关键应用

包括预测、目标识别、图像分割和跟踪等方面


在一些 OoC 中,对具有特殊意义的图像部分进行分割,并提取相关特征,从而为实验数据分析提供可靠的结果是十分重要的。例如,Yi 等人报道的脑肿瘤芯片可打印 3D 脑肿瘤细胞,其中在肿瘤细胞周围培养内皮细胞。本研究中的几个关键步骤包括使用不同的荧光标记法分离内皮细胞、肿瘤细胞和肿瘤干细胞。基于图像的自动处理系统可提取肿瘤芯片的不同片段,这将有利于对抗癌药物治疗进行分析。然而,由于图像本身的复杂性以及分割过程中的不均匀性和个体差异等问题,通过传统机器学习方法和典型神经网络很难实现图像的像素级分割。

2015年,Long 等人首次应用了全卷积神经网络(FCN),该网络接受任意大小的输入图像,并可以对图像进行逐像素分类。U-Net 模型是一种改良的 FCN 结构。因其结构形似字母 U 而得名,被广泛用于图像语义分割领域。Zaimi 等人使用 U-Net 架构来实现图像中轴突、髓鞘和背景的像素级分割。同样,该架构也可应用于 OoC 图像的像素级分割。在语义图像分割中,也可改变缩减像素采样过程中所用 CNN 架构的类型。Lim 等人重建了红细胞的所有像素,并大大提高了模型的图像质量和超分辨能力。这项研究有两个亮点:第一个亮点是生成数字体模作为输入,这克服了真值不足,并消除了引入的图像失真问题。第二个亮点是呈现了输入和输出之间有残差连接的一个 U-Net 架构,这减轻了训练过程中的梯度消失问题,并提高了系统性能。目前,开发人员现已在 ImageJ 软件中编写了用于单细胞分割的插件,这使得不熟悉深度学习的人员也可以在个人计算机上使用 U-Net 进行数据分析。除 U-Net 模型外,DeepCell、CDeep3M和 CellProfiler 等模型也被用于实现细胞图像的像素级分割。

最后,实现细胞形态和轨迹的实时可视化对于医学研究而言,是至关重要的。Zhao 等人对经典 U-Net 架构与玻璃-空气 Anderson 定位光纤(GALOF)进行了结合。这种名为 Cell-DCNN-GALOF 的成像系统可实时传输高质量图像。此外,该系统在不同深度、不同温度变化和不同纤维弯曲性能情况下的图像重建过程非常稳健。最重要的是,在对具有不同形态和类别的细胞进行检查时,该系统表现出了独特的迁移学习能力。这意味着我们可以使用 OoC 的细胞图像对该系统进行训练。还可通过 Cell-DCNN-GALOF 系统实现对细胞轨迹的实时监测。通过自动检测细胞移动轨迹并量化相关移动数据,深度学习还可为量化实验结果和开发 OoC 的新实验模型提供辅助参考。因此,我们相信通过深度学习的方式,可将 OoC 这一严重依赖人工数据处理和操作的传统方法转化为一种高度自动化系统。

05

总结和展望


 5.1 OoC 的未来应用 


近年来,深度学习已彻底改变了许多传统产业体系。而且,不同领域的研究人员正在尝试将深度学习技术与各自领域相结合。尤其是许多研究进展已经显示了 OoC 技术与深度学习集成的前景。其主要原因如下所示。

首先,应用了深度学习的开源项目已得到逐步改进,其中包括基于 TensorFlow、Pytorch 和 Keras 框架的源代码。根据这些改进,研究人员能够快速复制不同领域的开源工程代码,并将其应用于自己的具体任务中。其次,更完善的深度学习模式正在不断出现,其模式新颖,性能更佳。最终,这些模式将应用于与深度学习广泛融合的快速发展行业。最后,OoC 实验产生的多类型数据不仅复杂,而且数量巨大。引入深度学习技术,可简化劳动密集型的数据分析和特征提取步骤,缓解海量生物医学大数据带来的巨大挑战,解决以前认为不可完成的任务。

5.1.1 OoC 中的细胞器分割和跟踪

目前,深度学习在细胞生物学中的应用主要集中在全细胞的形态变化;但对亚细胞结构或细胞器进行分析,可提供额外的重要信息。最近,Lefebvre 等人开发了一个基于浅层机器学习算法的软件包,命名为 Mitometer,该软件可对图像和视频中的细胞线粒体进行快速分割和跟踪。这为 AI 在细胞生物学方面提供了一个令人兴奋的新研究方向。如前所述,深度学习可捕获数据的固有特征,比传统机器学习更高效、更准确。因此,我们相信,基于深度学习的细胞器分割和跟踪可针对 OoC 上的细胞/组织行为产生更多信息。

5.1.2 OoC 组织机械力控制

组织机械力控制是 OoC 最重要的特征之一。例如,以肺芯片为例,可在计算机控制的两相微流控系统中培养人气道上皮细胞。该系统可模拟阻塞性肺疾病气道损伤过程中液体栓塞的传播和破裂。由于施加组织机械力的时机至关重要,因此有必要开发一种基于细胞形态和微环境的自动化设备。深度学习可在不影响细胞活力的情况下对随时间变化的细胞过程和生物标记物进行检测;因此,其可对整个系统的性能进行实时监测。通过将深度学习与 OoC 结合,该系统可开发自动调节和控制 OoC 各种功能参数的潜力。

5.1.3 OoC 药物筛查

已经对作为人类相关疾病体外模型的 OoC 进行了广泛探索,其可成为开展药代动力学、药物毒性、药理学研究的优良平台。例如,Boos 等人在类器官系统中检测了受人肝脏代谢产物影响的拟胚体。该平台提供了一个有价值的工具,该工具可在体外试验中更全面地反映生理过程,从而增加对药物不良反应的预测能力。因此,OoC 可用于研究胚胎毒性。多个实例说明,基于深度学习的系统在准确预测治疗疗效和毒性方面具有潜力。因此,深度学习和 OoC 集成的预测能力是未来药物发现的一个有前景的重要工具。

5.1.4 罕见病芯片

OoC 技术已被广泛用于建立各种体外疾病模型。但是,近年来,由于缺乏适合临床试验的临床前模型,治疗罕见病的新药开发遇到了极大的阻碍。基于 OoC 的罕见病模型可以提供重要的实时数据,而这些数据通常无法在体内或临床样本中观察到。可以通过深度学习对这些数据进行进一步实时分析,从而在分子水平上实现对此类疾病发展变化的分析,最终获得疾病发生的具体机制。

5.1.5 人体芯片

人体芯片是进一步开发 OoC 的产物,由相互连接的腔室组成。每个腔室(即一个 OoC)均包含代表不同器官的特定细胞类型。所有的腔室都由一个微流控循环系统连接,该系统具有高度的模块化性质。不同腔室的特征可以通过深度学习方法来提取,前一个腔室的输出可以作为下一个腔室的输入加以利用。将多器官组织系统的相互作用联系起来,对基于生理学的药代动力学模型、定量系统药理学和其他模型有很大的好处。最近,一个机械询问器自动培养、灌注介质,并连接了流体系统,以维持8个血管化双通道器官芯片的活力和器官特定功能3周。此外,在介质循环平台上形成了一个高通量的人体芯片系统,实现了多器官并行实验。此外,人体芯片已经被用于研究肠道吸收、肝脏代谢和抗乳腺癌药物的活性。未来,通过利用深度学习对每个 OoC 的多种数据(如细胞生长、分化、代谢等)进行分析,可以将 OoC 组合成一个高度集成、可控的微流控系统,从而实现 OoC 的自我智能调节。事实上,仍然需要后续的工作和合作来推动多个 OoC 和深度学习的集成发展。

 5.2 未来在深度学习中面临的挑战 

尽管深度学习技术在特征表达和数据挖掘方面有着出色的表现,但仍需针对具体应用对其内部机制和计算策略进行优化。因此,开发一个高度自动化的 OoC 系统,为研究人员提供一个方便、可靠、集成的智能平台,是未来主要的发展方向和挑战。

5.2.1 数据处理

目前,人们获取 OoC 实验数据的能力已经大大提高,并积累了海量的大数据。因而,降低人工标注的巨大成本,自动挖掘和提炼海量数据的固有特征,是迫切需要克服的关键挑战。可以从以下几个方面进行探讨。

(1)数据扩增。可以引入 GAN、无监督数据增强等最先进的方法(谷歌最新提出的无监督数据增强方法在自然场景图像领域有较好的应用),以生成具有真实数据特征的模拟数据,扩大高价值数据样本的容量,并降低数据采集的成本。

(2)自动数据标注。通过开发自动数据标注的算法和工具,实现了对大量未标注数据的自动标注,这降低了人工标注的巨大成本,并提高了数据标注和开发的效率。

(3)半监督学习。可以引入半监督学习,以减少对大量标注数据的依赖。主动学习是半监督学习中的一种特殊学习方法,使用的标注数据很少;但其效果与监督学习相当。此外,自我监督学习作为一种无监督的学习方法,只使用未标注的数据来学习特征提取,其性能是通过预训练和微调来进行优化的。

(4)迁移学习。迁移学习也可以作为一种优秀的技术手段来减少对大量标注数据的依赖。使用来自其他领域的标注数据对该网络进行预训练。然后,可以通过特定领域的少量标注数据来完成对该网络的微调。

5.2.2 算法升级

(1)深度学习模型的定制设计。面对 OoC 领域多样化的应用需求,在自然光学图像领域中使用的深度学习模型无法直接应用。因此,需要对模型进行定制设计,并且必须在模型结构和深度网络布局方面进行改进。

(2)自动化网络设计。针对 OoC 的具体应用场景,可以利用神经架构搜索技术实现深度模型的自动构建和最优智能设计,这避免了基于专家经验的传统深度模型设计存在的复杂性和局限性问题。

(3)深度模型的迭代升级。面对日益更新的 OoC 数据,深度学习模型通常存在“灾难性遗忘”的问题。因此,要使深度学习模型能够处理新数据并保持稳健的性能,需要进一步探索深度学习模型的迭代升级技术。

(4)可解释性。深度学习模型通常存在“黑箱效应”的问题,即,内部机制并不明确。这就限制了对特定 OoC 的基本机制和相互作用原理的理解,进而缺乏可解释性和可靠性。因此,迫切需要开发具有可解释性的深度学习技术,以将深度学习的“黑盒”变成“白盒”,并从生物学的角度实现有意义的物理解释。

(5)模型压缩和加速。对于在线场景应用,需要平衡模型的准确度和推理速度。因此,有必要深入研究深度学习模型的压缩和加速技术,在保证准确度的前提下,尽可能压缩模型体积,提高推理速度。

5.2.3 计算能力

目前,深度学习模型的应用主要是基于计算硬件,包括 GPU、CPU、FPGA 和其他设备。GPU 和 CPU 用于深度学习模型的离线训练。特别是,由于 GPU 的高效计算能力,其已成为用于深度学习模型训练的主要硬件,包括 NVIDIA 公司的许多产品。FPGA 主要用于在线应用,是现实世界应用的边缘设备。

随着分布式技术的发展,目前 GPU 和 FPGA 等设备已经能够满足深度学习模型的应用。未来,需要结合硬件资源开展研究,以提高深度学习模型的推理效率,加强模型的可靠转移和快速部署,从而可以满足更多的应用场景。

作者:黄维李林、彭勃等

文章来源:Research



关注芯航资本公号,回复“器官芯片论文一”即可查看完整报告。



【声明】内容源于网络
0
0
芯航资本
芯航资本
内容 13
粉丝 0
芯航资本 芯航资本
总阅读12
粉丝0
内容13