大数跨境
0
0

人生若只如初见:初识统计学

人生若只如初见:初识统计学 可乐的数据分析之路
2019-10-13
0
导读:几个统计学的基本概念,当我们在谈统计学的时候我们在谈什么?
这个系列来分享统计学的一些知识,其他系列也会不定期更新。
 
一、统计学和我们的关系
当电视新闻主持人宣布,某项医学研究已经表明被动吸烟的人死亡风险比不吸烟的人高一倍时,几乎每个听众都认为他明白主持人的意思;当一个公众民意调查说65%的公众对总统表示满意,上下误差3%时,大多数人都认为我们明白65%和3%的含义;当我们听到天气预报明天下雨的概率为95%时,大多数人出门都会带上一把伞。
——摘自《女士品茶》
统计学不仅应用于数学、科学领域,它的很多思想已经渗透到了我们普通人平时的工作生活中。
 
大学里学过一门很基础的学科:概率论与数理统计,里面的概念和方法现在来看也很经典,市面上许多统计学的书籍、视频,但万变不离其宗啊,一本教材足矣。
 
二、几个概念
1、统计:归纳整理后得出的结论或数字。
2、随机现象:某些现象在个别试验中结果往往不确定,但在大量重复试验中又具有统计规律,如掷骰子。
3、统计学:揭示随机现象发生规律的一门学科,在收集数据、分析数据、下结论中寻求解决方法。
4、事件/随机事件:一个随机现象,简称事件,如明天是否会下雨,小明会中彩票吗。每次试验中总是会发生的为必然事件,必然不会发生的为不可能事件。
5、对立事件:每次试验中,A和B两个事件必然有且仅有一个发生,A和B互为对立事件。


6、独立事件:几个事件互不影响
7、频率:事件发生的频繁程度,频数/试验次数
8、概率:事件发生的可能性的大小,量度为[0,1]
9、变量:可以改变的量,如一个教室里学生数量的多少就是一个变量,学生进进出出,数量总是在变化。
10、常量:不能改变的量,如一个教室里座位数量的多少就是一个常量,因为座位是一个固定的值,不会改变。
11、变量类型
  • 连续变量:变量的取值范围是一个区间,且可以任意连续取值,相邻的两个数之间可以取无限多个值。又叫区间变量,如人体身高、体重等

  • 离散变量:变量的取值范围是有限的值,通常可以一一列举出来,如机器的台数、打靶的靶数等。分类变量也是一种离散变量,表示类别,如学生的成绩判断只能取:优秀、良好、合格、不合格四个值,有的时候会用数字来代表文字,如规定1代表优秀,2代表良好,3代表合格,4代表不合格。

12、个体:随机试验中每一个观察值
13、总体:随机试验中全部观察值,也是所有个体的集合
14、样本:总体中选取出来的一部分对象
15、抽样:随机地从总体中抽取一部分个体作为样本,如果总体中的每一个个体被抽取为样本的几率都相等,这样的抽样方法叫做简单随机抽样,抽取出来的样本叫做随机样本。
16、统计量:样本特征的统计指标,如样本平均值、样本方差、样本标准差等
17、总体参数:总体特征的指标,如总体均值等。
如调查深圳市民每年的读书情况,显然不可能去问所有的市民,只能去通过调查一部分人的观点来代表所有人的观点,这里单个深圳市民就是个体,所有的深圳市民就是总体,被抽出来调查的部分市民就是样本,部分市民的读书情况为统计量。
 
三、当我们谈统计学的时候,我们在谈什么?
《女士品茶》这本书讲了统计学的发展史,是对我们理解什么是统计学非常好的一本书,全书没有一个公式,作者就是试图通过直白的语言讲述统计革命,有点类似《上帝掷骰子吗》这本书(这本书是讲物理学的发展史),感兴趣的小伙伴可以去看一下,或后台回复“女士品茶”,我给大家分享电子版。
 
这本书最后提了3个问题,我觉得非常引人深思,拿出来和大家讨论:
  1. 可以用统计模型来做决策吗

  2. 当概率应用于现实生活中时其含义是什么

  3. 人们真的懂得什么是概率吗

 
欢迎留言区共同探讨,下期文章揭晓书中对于这3个问题的理解



提供入门级数据分析的学习路线规划,分享从Excel到统计学的干货。数据分析是一项技能,希望人人都能分析数据。
相关内容:
SQL学习:MySQL入门 | 库/表/记录的增查删改 | 对行和列的操作 | 计算字段 | 分组和子查询
Excel分析方法:RFM分析 | 综合指标分析 | 平均和交叉 | 分组 | 对比 | 时间序列分析 | 回归分析 | 描述性统计分析 | 相关性分析 
Excel图表:数据地图 | 数据透视表 | 5个基本图 | 13个进阶图 | 直方图 | 控制图 | 排列图
Excel函数:日期文本函数 | 查找引用函数 | if函数 | 统计函数
用Excel进行数据分析:数据获取 | 数据处理 
方法论:如何系统地学习Excel | 数据分析学习 | Excel相见恨晚的技巧 


码字不易,喜欢就点个右下角 在看 呗
【声明】内容源于网络
0
0
可乐的数据分析之路
《Excel数据处理与分析——数据思维+分析方法+场景应用》作者,分享数据分析、Excel、SQL、Python、数据思维的文章,以及生活中的数据分析。
内容 617
粉丝 0
可乐的数据分析之路 《Excel数据处理与分析——数据思维+分析方法+场景应用》作者,分享数据分析、Excel、SQL、Python、数据思维的文章,以及生活中的数据分析。
总阅读315
粉丝0
内容617