大数跨境
0
0

【医学统计系列】开篇第1讲

【医学统计系列】开篇第1讲 简博士数据分析吧
2022-10-26
2
导读:全新的医学统计系列正式开篇,内含团队成员招募~



内容提要:

* 统计学无处不在

* 统计的意义

* 统计在医学分析领域的应用

点击蓝字 |关注我们

「简博士和阿城学长强强联手,共同开启医学统计课程啦!」

欢迎回来。从这期开始,我们将新开辟一个「医学统计系列」,当然在开始之前,有不少非统计专业的小伙伴可能还不了解统计的重要性,那么我们就先说说统计学到底有什么用,或许能给你的学习和工作带来启发。

壹 统计学无处不在

让咱们先看一组数据,按照统计,我国约有14亿人,所以,即便我们的浏览量过万,也不过是「总人口的0.0007%」

是不是突然有种渺小的感觉?

不过如果按照那个《十分钟 机器学习》的视频播放量来看呢,目前已突破 20 万,百分数就一下子提到「0.014%」 ,貌似感觉好多了。

再比如我国有400万医学从业者,假如有1/4的从业者来观看我们的视频,好嘞,噌一下子,百分数摇身一变成为「0.25%」

这样我们才有做视频的动力嘛!所以欢迎各位小伙伴随手点个关注哦!

以上跟大家说的就是一个超级简易的统计,我们通过观看人数与总人数的比值来估计比例,这既可以用「古典概率」来解释,又可以用「极大似然估计」来说明,挺有意思的吧!

其实,「统计学是无处不在的」。有些甚至就是我们生活的一部分。

比如我们关心的:

  • 国足什么时候才能赢?
  • 新冠疫苗什么时候才能上市?

  • 为何在电影《我不是药神》中,那么多人拼了命买印度高仿药?

  • 新冠混检为何10支一管或20支一管?

  • 救援物资怎样才能高效分配?

  • 怀有双胞胎的孕妇,有多大的概率怀有同卵双生的宝宝?

当然,有些时候统计也没有这么明显,不过仍然与我们息息相关,它可以是很酷的核心技术,例如“Hi Siri,今天天气怎么样?”“小爱同学,帮我定个闹钟”。

贰 统计到底指的是什么呢?

小简曾经遇到过一个住在统计局附近的人,当聊到我是做统计的时候,对方突然问起“你们平时汇总些什么数据呢?”这时我才知道,原来在他心里,统计就是到处收集数据,“统计”貌似就是“计数”的含义。这样一说,突然感觉像回到了结绳时代。

当然,这其实也是古代统计发展的一部分。要知道,在奴隶制度时期,也就是纣王妲己存在的「商代」,就有类似于“统计局”的机构存在了。

其他世界各地也是类似的情况,所以从历史渊源来说,统计学实际上是为国家服务的。我们通过观察可以发现Statistics的词根——“State”正是国家的意思。现在,随着新时代的到来,信息充盈,数据无处不在,「统计学也逐渐发展成一门和数据打交道的科学和艺术」。之所以说是艺术,是因为我们怎么和它打交道就是一门非常有意思的学问。

可是,生活中还有一门专门研究数字的学科——数学,它们之间有何不同?区别又在哪里呢?数学家「伽利略」曾经说过:

数学是上帝书写这个世界的语言!

但是,数学研究更多聚焦在「确定的科学」,或许造物主的确是遵循某个确定的公式在创造世界,比如女娲造人,也是有鼻子有眼睛有腿有脚的。

可是如果全部都是确定的,我们不过就是生产线上产出来的一个个零件罢了。真实的世界瞬息万变,多姿多彩,自然处处充满着不确定性,而这些「不确定性」恰好就是我们统计要研究的。

统计思维总有一天会像读与写一样成为一个有效率公民的必备能力。——威尔斯

同样,科学家「高尔顿」也表示:当科学的探索者在前进的过程中披荆斩棘时,唯有统计学可以帮助他们开辟一条道路。

弗朗西斯·高尔顿 英国科学家、探险家

所以,在简博士看来,如果数学是上帝书写这个世界的语言,那么统计学无疑就是人类解释这个世界的语言

虽然人人都想探索无穷的世界,但用统计的知识一时半会儿也是丈量不完的。现在,让我们只聚焦于医学统计学,看看统计的思想如何巧妙地用于医学分析吧!

叁 统计在医学分析领域的应用

「Sigmoid函数」的应用解决了神经网络反向传导的难题后,「AI」也已以一种不可抵挡的势头进入了各个领域,这其中就包括了「生物医药领域」

<<< 左右滑动见更多 >>>

其实AI的核心还是基于数学、统计学以及机器学习方法的科学,那么AI具体是如何通过统计学和数学去影响生物医药领域的呢?让我们通过以下几个例子来了解一下吧。

1.统计检验

「正态t检验」:常用于limma包的芯片测序与差异分析

「非正态wilcoxon检验」:常用于二代测序的差异分析

「卡方检验」:常用于分类变量的筛选

2.机器学习模型

监督类

「单因素多因素Cox分析」:常用于筛选与愈后生存状态和生存时间相关的特征名称,例如:基因名或临床特征等

无监督聚类

「PCA」:常用于查看样本之间的差异,以及判断离群样本等

神经网络

「深度学习」:在进行医学影像识别分析中的应用相当广泛

由此我们可以看出,其实每种模型都能在生物医学领域当中找到应用场景。当然对于医生、医学生或者生物医药从业者不用完全掌握模型中所有的数学推导,只用掌握「API(应用程序接口)」,并且能够根据需求调整其中的参数,以及知道在哪些场景可以运用即可。

以下接入一个招募启事!

招募启事

「统计汪」团队成立之际,我们面向大家招募「符合以下条件」小伙伴:

  • 有想法从事「医学统计」「生信」「临床分析」「meta分析」的;
  • 发表过以上任意一种「sci」的;
  • 有想法当讲师的。

有意者欢迎扫码加V哦,请备注“加入团队”!

好啦,今天关于「医学统计入门」的内容我们就讲到这里。感兴趣的小伙伴也可以点击视频查看,记得「点赞+关注+在看」,谢谢你的支持哦~

拓展阅读

【数据科学之基础思维系列】第4讲:矩阵和矩阵运算

【数据科学之基础思维系列】第3讲:线性相关性和向量空间

欢迎大家关注简博士的B站和公众号,在公众号私信“入群”,可以与小伙伴们一起讨论问题哦。


【声明】内容源于网络
0
0
简博士数据分析吧
信息时代最不缺的是什么?数据!最缺的是什么?数据分析的思维!在这里,你将获取神秘的力量,推开数据之门!
内容 181
粉丝 0
简博士数据分析吧 信息时代最不缺的是什么?数据!最缺的是什么?数据分析的思维!在这里,你将获取神秘的力量,推开数据之门!
总阅读42
粉丝0
内容181