

Plant Communications 拟南芥单细胞文章，数据和代码都有

小明的数据分析笔记本

2024-10-26

https://www.sciencedirect.com/science/article/pii/S2590346224002864

论文

Single-cell network analysis reveals gene expression programs for Arabidopsis root development and metabolism

10× Genomics

我在网上找资料，这个单细胞测序技术会有三个fastq文件

这篇文章的原始测序数据我下载下来是两个文件

一个序列很短另外一个序列90几bp

这里不太理解的地方：

所有细胞的数据全在一个fastq文件里，cell ranger去做比对，然后就能够得到行是基因，列是细胞的表达量矩阵，这个过程是是怎么判断哪个数据来源于哪个细胞的呢？

这个论文里提供了最终的表达量矩阵

https://www.ncbi.nlm.nih.gov/geo/query/acc.cgi?acc=GSE147289

这个表达量矩阵的列的名字是一串序列，这个序列是用来区分细胞的index吗？

试着跑一下Seurat流程

论文中提供的代码

https://ars.els-cdn.com/content/image/1-s2.0-S2590346222000530-mmc9.txt

代码

library(tidyverse)
library(Seurat)
data.table::fread("GSM4423536_AT12_scRNA_gene-cell.matrix.txt.gz") %>% 
  dim()

data.table::fread("GSM4423536_AT12_scRNA_gene-cell.matrix.txt.gz") %>% 
  .[1:5,1:5]

seurat_dat<-data.table::fread("GSM4423536_AT12_scRNA_gene-cell.matrix.txt.gz") %>% 
  column_to_rownames("gene")

seurat_obj<-CreateSeuratObject(seurat_dat,
                               project = "AT12",
                               min.cells = 3)

AT12<-subset(seurat_obj,subset = nFeature_RNA < 6500 & nFeature_RNA > 650)
AT12<-NormalizeData(AT12,normalization.method = "LogNormalize")
AT12<-FindVariableFeatures(AT12,selection.method = "mvp")
AT12<-ScaleData(AT12,features = rownames(AT12))
AT12<-RunPCA(AT12)
ElbowPlot(AT12,ndims = 50)
AT12<-FindNeighbors(AT12,dims = 1:20)
AT12<-FindClusters(AT12)
AT12<- RunTSNE(AT12, dims = 1:20)
AT12<- RunUMAP(AT12, dims = 1:20)

library(RColorBrewer)
library(ggsci)
color1<-brewer.pal(12,"Paired")
color2<-pal_npg("nrc",alpha = 0.7)(10)
DimPlot(AT12,label = T,reduction = "umap",label.size = 5,cols = append(color1[c(1:9,12)],color2),
        pt.size = 1)

这个结果和论文中是完全反着的，x和y轴应该是分别取了负数

论文中还有很多其他分析的代码

欢迎大家关注我的公众号

小明的数据分析笔记本

小明的数据分析笔记本公众号主要分享：1、R语言和python做数据分析和数据可视化的简单小例子；2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记；3、生物信息学入门学习资料及自己的学习笔记！

【声明】内容源于网络

小明的数据分析笔记本

分享R语言和python在生物信息领域做数据分析和数据可视化的简单小例子；偶尔会分享一些组学数据处理相关的内容

内容 971

粉丝 0

小明的数据分析笔记本分享R语言和python在生物信息领域做数据分析和数据可视化的简单小例子；偶尔会分享一些组学数据处理相关的内容

总阅读494

粉丝0

内容971