大数跨境
0
0

跟着Nature Genetics学做图:R语言ggplot2做热图展示基因存在缺失变异

跟着Nature Genetics学做图:R语言ggplot2做热图展示基因存在缺失变异 小明的数据分析笔记本
2023-12-19
2
导读:论文 Pan-genome analysis highlights the extent of genomi

论文

Pan-genome analysis highlights the extent of genomic variation in cultivated and wild rice

今天的推文来试着复现一下论文中的figure5a

自己构造的示例数据部分截图

image.png

读取数据

library(readxl)
library(tidyverse)
dat<-read_excel("data/20231219/20131219.xlsx") %>% 
  mutate(group3=case_when(
    group2 == 0 ~ "0",
    TRUE ~ group1
  ))
dat %>% head()

dat %>% pull(x) %>% unique() -> x.levels
dat %>% pull(y) %>% unique() -> y.levels

组图代码

library(ggplot2)
dat %>% 
  mutate(x=factor(x,levels = x.levels),
         y=factor(y,levels = rev(y.levels))) %>% 
  ggplot(aes(x=x,y=y))+
  geom_tile(aes(fill=group3),
            color="gray")+
  theme_bw(base_size = 15)+
  theme(panel.grid = element_blank(),
        panel.border = element_blank(),
        axis.ticks = element_blank(),
        axis.title = element_blank(),
        axis.text.x = element_text(angle=90,hjust=0),
        axis.text.y = element_text(face = "italic"))+
  scale_x_discrete(position = "top",
                   expand = c(0,0))+
  scale_y_discrete(expand = c(0,0))+
  scale_fill_manual(values = c("0"="white",
                               "A"="#fe0000",
                               "B"="#c0a100",
                               "D"="#00b650",
                               "E"="#f38dd5",
                               "F"="#7230a3",
                               "G"="#02b5fc"))+
  theme(legend.position = "none")

image.png

作图代码不是难点,主要是作图数据准备成什么格式。这里用来填充颜色的数据,基因不存在统一填充为0,基因存在填充为不同的群体值。

示例数据和代码可以给推文打赏一元获取

欢迎大家关注我的公众号

小明的数据分析笔记本


小明的数据分析笔记本 公众号 主要分享:1、R语言和python做数据分析和数据可视化的简单小例子;2、园艺植物相关转录组学、基因组学、群体遗传学文献阅读笔记;3、生物信息学入门学习资料及自己的学习笔记!


【声明】内容源于网络
0
0
小明的数据分析笔记本
分享R语言和python在生物信息领域做数据分析和数据可视化的简单小例子;偶尔会分享一些组学数据处理相关的内容
内容 971
粉丝 0
小明的数据分析笔记本 分享R语言和python在生物信息领域做数据分析和数据可视化的简单小例子;偶尔会分享一些组学数据处理相关的内容
总阅读218
粉丝0
内容971