大数跨境
0
0

生信孔子学院(六)

生信孔子学院(六) Dr.X的基因空间
2019-12-17
0
导读:结课

对外生信教学

写在前面的
这次是结课内容了,对Shs的教学算是结束一个段落了。最近去华农做了一次学术报告,发现其他人做的确实很好,打心底说是真的很好。在这之中发现了自己的不足,也找到了自己的改进目标。华农的学生或者毕业于华农的学生确确实实将天下大事必做于细的精神传承。这是做科研难能可贵的。对于Shs的教学我也有一些新的感悟。

生物信息学如何学习的新思维

对于Shs学习从宏基因组数据中检测病原微生物,我教给了他最简单、最直接的方法。没有让他学习编程也没有让他花太多时间在Linux学习上。或许从这里面我对生物信息学的学习有了新的认识,也想起了之前刘老师之前对我说过的话,想解决生物学问题还是想解决生物信息学问题,以及我也想起了大家在初始学习生物信息学时在犹豫是否要学习编程。我在这里可以很自信的说,如果想把生物信息学学好,想用生物信息学技术解决更大的难题,编程是必须要学的,计算机知识,Linux基础也是必须要掌握的。但是如果只是想用生物信息学,没有必要学习编程,也没有必要花大量时间在Linux这些知识上。点击原文链接,你便可以清楚地看见我是如何在不教编程不教大量计算机知识的情况下让一个巴基斯坦小白熟练宏基因组数据病原检测的。其实做生物学,我认为脑子是个很重要的东西,必须要明白你需要做什么?需要获得什么样的结果?获得这个结果的途径有哪些?只有想明白这些问题,才可以做顺。

说的容易,做的也没有那么难

可能有的人会说这话说的容易做的难,其实并不是。条条道路通罗马,交通工具有好坏。诚然,如果你会编程,很多复杂的数据格式可以通过编程变为简单可读的简单格式。但是确实有很多人没有时间也无法在短时间培养起编程的思维,甚至也有一部分人很难适应编程。难道不会编程就等于无法做生物信息学了吗?我相信只能手机很多人会玩吧?或者说PS/AI很多人也不会吧?但是美图秀秀绝大多数人都能会用吧?这就是思维,学会寻找现成的工具达成分析目标。就比如我教Shs,Blast输出的标准格式是很占磁盘空间的文件。操作这种文件很慢,如果想在标准格式文件中检测病原菌,就需要用到grep去匹配,如果为了节约磁盘空间输出了6版本的格式,这种格式subject只有id号,如何去对应信息呢?我想会编程的人肯定是自己写脚本去匹配或者去爬虫id号对应的信息。但是我却教Shs,把id号批量放进Bactch Entrez,这样不用编程就知道结果,更有简便的是通过excel过滤,或者通过awk过滤contigs长度、相似度,把最长、最相似的contig对应的id拿去检索。这种方法对付普通宏基因组数据是足够的了。而且他也很快学会并且熟练了这个操作。所以我认为,找到一个简便的方法学习生物信息学不是不可以!

写在后面的
第一期对外生信教学结课了。以后还会继续有。接下来该在另外一个公众号上写写推文了。我的第一个巴基斯坦学生在我这里结业了!

【声明】内容源于网络
0
0
Dr.X的基因空间
【中国科学院博士】10年生命科学数据挖掘研究经验,关注生物医药领域体外诊断(IVD)方向,如肿瘤早筛、传染病未知病原快速检测中的技术创新及其与人工智能(AI)的赋能应用
内容 176
粉丝 0
Dr.X的基因空间 【中国科学院博士】10年生命科学数据挖掘研究经验,关注生物医药领域体外诊断(IVD)方向,如肿瘤早筛、传染病未知病原快速检测中的技术创新及其与人工智能(AI)的赋能应用
总阅读0
粉丝0
内容176