大数跨境
0
0

性状相关可视化 | 小甜甜VS牛夫人

性状相关可视化 | 小甜甜VS牛夫人 育种数据分析之放飞自我
2021-04-12
2
导读:被人推荐啦,哈哈

1. 被人推荐

看微信群中有人聊天,浏览了一下,不同专业的内容比较分散,很多读都读不通顺,隔行如隔山,真是如此!

忽然,一个朋友在里面推荐的几个R语言的公众号,学生物的推荐关注:

R语言是我们的共同语言:我点进去一看:

  • 木舟笔记:https://mp.weixin.qq.com/s/Qqxa8WfKU-tiqpegqueeww
  • R语言数据分析指南,https://mp.weixin.qq.com/s/yQqmETSQfPoNCw-osrOeGQ
  • 生信技能树:https://mp.weixin.qq.com/s/e_4dEtsVnypa5s-NXxkMqg
  • 作图丫:https://mp.weixin.qq.com/s/RywicX-6M2wpNIZKE22BiA
  • R语言和统计:https://mp.weixin.qq.com/s/1jlpZ738SRxFLdP3t4ddhA
  • 联川生物:https://mp.weixin.qq.com/s/U4hM1Qx8ADIRUWNbWLglUA
  • 科研生信充电宝:https://mp.weixin.qq.com/s/g-E99x3v2LZRFslKVtRRRA
  • 统计之都:https://mp.weixin.qq.com/s/ExZG64lguQRGGHSYrUkZsw
  • 小明的数据分析笔记本:https://mp.weixin.qq.com/s/clsq4-CASCYPdGKKgUxhZw
  • 生信菜鸟团:https://mp.weixin.qq.com/s/ct_pgUHy-rfstZJtdU-7_w
  • YuLabSMU: https://mp.weixin.qq.com/s/ay9kli9V2JENJRHNQSbohA
  • 数据驱动实践:https://mp.weixin.qq.com/s/zgYsmdeDYVv-yoC2L8NCLw
  • 医学统计与R语言:https://mp.weixin.qq.com/s/6d7vR1BhoLkVv2pXc51guA
  • 当统计学遇到R语言:https://mp.weixin.qq.com/s/-f2shZfsGeo-Pdq7z0wbpw
  • 育种数据分析之放飞自我:https://mp.weixin.qq.com/s/ubfHmAyQmHEPYvC7seqH3w

最后一个竟然是我的。。。高兴。。。

这几个公众号,我大都关注了。其余没有关注的,我也关注了一波。

毕竟,一打开这么多干货的公众号,感觉整个人都不同了,自我感动得热泪盈眶,不管学习成绩怎么样,但是书包一定要塞得满满的……

2. 正题

https://ggobi.github.io/ggally/reference/ggpairs.html 这篇文章,做多性状相关分析的可视化非常漂亮,抱着学习的态度,借鉴学习一下(读书人的事情不能叫抄。。。)

图片真得很漂亮,三个品种的多性状数据,相当于是分组数据的相关分析。这里记录一下学习笔记。

3. 没有分组的数据

载入数据:

library(learnasreml)
data(fm)
head(fm)
# 直接出图
library(GGally)
ggpairs(fm[,6:13]) # 6:13列为数据

3.1 加上颜色

因为ggpairs加颜色的话,需要一个因子类型的分组数据,这里手动设置一个分组:Group

## 模拟一个分组,只有一组:
str(fm)
fm$Group = 1
fm$Group = as.factor(fm$Group)
ggpairs(fm[,c(6:13,14)])

### 一个分组可视化,加颜色
ggpairs(fm[,c(6:13,14)],ggplot2::aes(color = Group))

可以看到,最下方是每个性状的直方图,右边是每个性状的箱线图,666。

3.2 美化一下

ggpairs(fm[,c(6:13,14)],ggplot2::aes(color = Group)) + 
  theme(axis.text = element_text(colour = "black", size = 11),
        strip.background = element_rect(fill = "#d63d2d"),
        strip.text = element_text(colour = "white", size = 12,
                                  face = "bold"))

4. 多个分组的数据

4.1 Spacing是两个密度

## 两个分组,Spacing
str(fm)
ggpairs(fm[,c(6:13,2)]) 

4.2 加点色(shai)

## 两个分组,加颜色
ggpairs(fm[,c(6:13,2)],ggplot2::aes(color=Spacing)) 

很不错。

4.2 再来点美化

### 两个分组,加颜色,加美化
ggpairs(fm[,c(6:13,2)],ggplot2::aes(color=Spacing)) + 
  theme(axis.text = element_text(colour = "black", size = 11),
        strip.background = element_rect(fill = "#d63d2d"),
        strip.text = element_text(colour = "white", size = 12,
                                  face = "bold"))

5. 小甜甜和牛夫人

花心大萝卜,以前用PerformanceAnalytics时喊人家小甜甜,现在发现了GGally喊人家牛夫人。

# 另一个包:
p_load(PerformanceAnalytics)
chart.Correlation(fm[,c(6:13)])

同样的数据,对比GGally包:「比较两者」

相比较GGally包,PerformanceAnalytics包有以下缺点:

  • 1,不支持分组数据
  • 2,没有箱线图的叠加
  • 3,缺乏后期的美化

光是具有分组功能,就是选择GGally的理由!


【声明】内容源于网络
0
0
育种数据分析之放飞自我
本公众号主要介绍动植物育种数据分析中的相关问题, 算法及程序代码.
内容 912
粉丝 0
育种数据分析之放飞自我 本公众号主要介绍动植物育种数据分析中的相关问题, 算法及程序代码.
总阅读162
粉丝0
内容912