一个基因的表达需要转录因子结合基因启动子区通过与其他蛋白以及RNA聚合酶的共同作用从而完成基因的表达。那么在基因的启动子区就需要一个开放的染色质区域为转录因子的结合提供空间,对于紧紧缠绕在核小体上的DNA,他们又是如何被打开从而完成后续调控的呢,这时候就需要先锋转录因子(pioneer transcription factors)为其他的转录因子的结合打开空间。2018年7月,NG发文探究转录因子Grainyhed通过调控核小体重塑来启动上皮增强子的激活,从而完成基因的调控。
1
染色质的自然变异预测潜在的染色质调控因子
为了探究在特定组织中建立染色质可及性所必需的DNA特征,对23中不同品系的近交果蝇上皮组织的眼 - 触角形成盘组织进行了30个样品的ATAC-seq,发现样品间开放染色质谱高度相似(P= 0.76-0.96)但又与成人大脑等非上皮组织的开放染色质谱有显着差异(P=0.25-0.5),在30个样品的实验中,鉴定到了30774个染色质可接近区域,并将染色质可接近区域与该区域内的297000个SNP位点进行关联,鉴定了4289(~1.5%)SNP其与周围区域的可接近性变化显着相关(FDR <0.05)与其(图1b),称为染色质可接近性QTL(caQTLs)。
对于SNP如何影响染色质的可接近性的一种解释为序列的改变影响了关键转录因子的识别序列,以此对包含caQTL的区域序列进行了分析,发现包含了18000个转录因子的结合保守序列。在诸多转录因子中作者发现Grainyhead(Grh)的改变与染色质可接近性改变高度一致,因此判断Grh结合位点可用来判断染色质区域的可接近性。

2
Grh在上皮细胞的染色质形态调控中起关键作用
Grainyhead是一种高度保守的转录因子,在上皮细胞命运决定、伤口愈合中具有重要作用。从眼-触角形成盘鉴定的30774个可接近区域中10.5%(3246个区域)具有至少一个Grh结合位点。 这些3246个潜在的Grh靶区域大量位于上皮发育等GO注释的1786个基因附近。在眼-触角形成盘大部分细胞中Grh稳定地结合其靶位点。因此假设Grh靶区是最容易接近的,同时Grh蛋白在眼-触角形成盘所有细胞中普遍表达也印证了这一点。
为了验证Grh实际上是否与前面预测的Grh结合位点结合,对Grh-GFP进行了ChIP分析,并且还重新分析了公布的Grh ChIP-seq数据。与染色质可及性一致变化的相同Grh基序(图1c,d)是Grh-ChIP峰中显著富集的。有趣的是,3246个Grh靶区域的ChIP-seq信号与ATAC-seq信号显著相关(P=0.92)。

3
Grh结合位点对于增强子活性是必须的
综合以上,发现Grh结合位点的变化可能会改变增强子区域在上皮细胞中的可及性。 为了测试这些区域是否确实是功能性增强子,克隆了四个增强子对,每个增强子对代表不同的SNP序列,一个具有影响Grh结合位点的caQTL,一个没有影响Grh结合位点的caQTL。 将这些区域分别克隆到GFP报告载体中并稳定整合到苍蝇基因组中的相同位置。
接下来,通过检查眼-触角形成盘中GFP报告基因的表达模式,测试了caQTL对这些潜在增强子活性的直接影响。具有完整Grh结合位点的驱动GFP表达,缺乏Grh结合基序的主要是不活跃的。 因此,Grh结合位点对于增强子可接近性和活性都是必需的。

4
Grh调控了增强子的可接近性而非活性
转基因报道分子显示Grh结合位点的存在与GFP表达之间存在明显的相关性。然而,四种表达模式彼此不同并且不是普遍存在的。尽管如此,考虑到Grh结合调控染色质可接近性并且Grh在眼-触角形成盘中普遍表达,结合其他研究中也报道了尽管可被TF接近或结合但未产生任何显着转录活性的区域,假设Grh结合打开或“引发”其靶标增强子,而不必激活它们。
为了测试Grh是否与增强子结合而不激活它们,测量了另外21种Grh靶增强子的报告活性,其中15种在眼-触角形成盘中显示出活性。有趣的是,这些Grh结合增强子的可及性与GFP报告基因活跃的细胞数之间没有相关性(= 0.05)(图4b)。此外,使用单细胞ATAC-seq,发现可获得Grh结合增强子的单个细胞的实际数量与它们的大量ATAC-seq信号相关(P= 0.82,图4c,补充图2) )。这些结果已经表明Grh绑定打开了它的目标增强子,而不必激活它们。
接下来,为了证明这些增强子确实可以在它们不活跃的细胞中可获得,对来自眼-触角形成盘的细胞的特定亚群进行FAC分选并进行ATAC-seq。这表明Grh结合的增强子在分选的亚群中与组织的其余部分相似,并且在亚群中可以获得多种增强子,如40436和47530,而在该域中没有GFP报告子活性。这些发现表明,Grh结合打开或“引发”其靶标增强子,而不激活它们。

5
Grh增强子的进化比较识别候选活跃因子
已测试的Grh结合增强子显示出多种表达模式,表明多个TF可以与Grh合作。为了鉴定候选的co-TF,进行了跨物种基序分析,在另外10种果蝇物种的眼 - 触角盘中进行了ATAC-seq,并选择了具有Grh基序并且在其他物种中可获得的保守增强子。从转录因子数据库中扫描这些增强子的保守基序,并鉴定了几个共保守的TF结合基序。其中,最保守基序是(CANNTG),一种E-box基序,其最可能的候选活跃因子是Atonal,一种在胞中的bHLH因子。E-box序列与92 Grh增强子保守,其位于Ato诱导的基因附近,这表明[Grh + Ato]增强子是功能性的。此外,从20个经过实验验证的Atonal靶标增强子中,发现6个被Grh和Ato共同结合,并鉴定了4个在Atonal表达细胞中有活性的新Grh靶标增强子。由此得知,通过Grh引发增强子的活性需要募集Atona等其他因子。

6
功能丧失和功能获得实验表明,Ghed是一个先锋转录因子
先锋TF的主要功能是它们可以将封闭的染色质中结合区域打开,使它们的目标区域可以被其他蛋白质结合。这意味着去除先驱因子应该直接降低其目标区域的可及性,反之亦然。为了验证Grh是上皮细胞的先驱转录因子,首先研究了Grh蛋白的缺乏如何影响上皮细胞的开放染色质景观。因此,在眼睛触角盘上进行大量ATAC-seq,将grhIM突变体的可接触的染色质可接近性与对照进行比较,鉴定了1076个grhIM突变体中具有降低的可接近性区域。其中Grh基序在这些区域中强烈富集。已知的Grh靶标增强子grh突变体盘中失去了可及性。总体而言,在Grh突变体组织中,3246个Grh靶区域的可及性明显较低,Grh的损缺失直接降低了其目标区域的可及性。
接下来,测试了Grh是否能够与核小体DNA结合,使其目标区域易于接近,作者分析了幼虫大脑,其主要包括不表达Grh的神经元和神经胶质细胞,发现大部分(74.3%)的Grh目标区域是不可接近的。在第3龄果蝇幼虫脑的所有神经元中异位表达grh(grhN)18和24小时,基本上所有3246个Grh目标区域,在异位Grh表达时获得了可及性。此外,在1774个只有Grh基序显着富集区域中,其可接近性大幅增加。因此,这些结果表明Grh是一种先驱因子,足以直接和特异性地打开其靶区域。

7
人类同源Grh发挥了相似的作用
已经确定果蝇上皮细胞Grh调控了染色质的可接近性。那么在哺乳动物和人中,Grh是否也发挥了同样的功能呢?对其进行了探究,哺乳动物含有三种Grainyhead 同源基因GRHL1,GRHL2,GRHL3, 首先,使用公开可用的GRHL2的ChIP-seq数据,发现Grh的DNA结合基序在果蝇和哺乳动物之间是保守的。另外,GRHL1特异性结合DNA的关键氨基酸在果蝇Grh的DNA结合结构域中都是保守的。这些发现表明Grh蛋白和DNA之间的部分相互作用机制从果蝇到人类是保守的。
为了确定GRHL因子是否在建立哺乳动物染色质的可接近性发挥重要作用,使用来自ENCODE62数据分析了上皮样乳腺癌细胞系MCF7的染色质可接近性。对于GRHL基序MCF7细胞的整个可接近的染色质图谱显着富集,其存在于22.8%的可及区域中。这些可接近的GRHL靶区域位于1337个表达基因附近,这些基因GO富集于上皮发育等。结合先前的研究,这些结果表明GRHL转录因子在哺乳动物上皮可及染色质景观中起关键作用。
最后,研究了GRHL转录因子是否也对染色质可接近性有直接影响。 GRHL1和GRHL2基因在MCF7细胞中高度表达,已经鉴定了一组预测的GRHL靶区域。为了测试这些区域的可及性是否归因于GRHL结合,对对照MCF7细胞和MCF7细胞进行了全-ATAC-seq,其中使用siRNA将所有三个GRHL基因敲低48小时。 发现GRHL敲低后,其靶标区域的可接近性明显降低。这些发现表明Grh作为上皮染色质开放性调控的先驱因子,其功能在果蝇和哺乳动物之间是保守的。

总的来说,从基因序列、染色质开放性和增强子的激活等层面,对于先锋转录因子Grh进行了系统描述,以染色质开放性为中心,探究在Grh在果蝇上皮细胞中的功能与作用方式进行探究,挖掘了Grh的作用机制。在ATAC-seq技术如火如荼的今天,染色质开放性机制以及其对于基因的调控研究越来越被人关注,转录因子与染色质开放性也必将成为研究热点。

