
内容选取自彭健教授所著
《母猪营养代谢与精准营养》第十章。
原创内容,欢迎转发,务必注明信息来源。
规模化猪场的数据是十分庞大而复杂的,这对数据统计分析的需求及对数据处理能力,尤其是“海量”数据的处理、挖掘及分析能力提出了更高要求。传统的数据统计分析方式统计效率低,统计周期长,而且不够直观清晰,这已远远不能满足实际需求。而数据统计分析软件可将企业越来越庞大的数据运用到数据统计分析软件中,帮助数据分析师在短时间内完成复杂的数据分析计算过程,输出准确的数据分析结果,提高工作效率。基于畜牧科研中软件使用习惯,统计软件篇内容将连续4期重点介绍SAS、SPSS、R语言和Python语言4款软件的基本情况、功能和特点。读者在学习统计分析软件时,可以根据自己的实际要,选择其中的一到两种软件进行学习并使用。本期首先介绍SAS软件的相关信息。
SAS系统是一个用于数据分析和决策支持的大型集成式与模块化的组合软件系统,由三十多个专用模块组合而成。主要功能包括SAS/STAT(统计分析模块)、SAS/GRAPH(绘图模块)、SAS/QC(质量控制模块)、SAS/ETS(经济计量学和时间序列分析模块)、SAS/OR(运筹学模块)、SAS/IML(交互式矩阵程序设计语言模块)、SAS/FSP(快速数据处理的交互式菜单系统模块)、SAS/AF(交互式全屏幕软件应用系统模块)等等。各个模块之间既相互独立又相互交融与补充,可以根据具体应用建立相应模块的信息分析与应用系统。
其中,Base SAS模块是SAS系统的核心,承担着主要的数据管理任务,其它各模块均在Base SAS提供的环境中运行,用户可选择需要的模块与Base SAS一起构成一个用户化的SAS系统。
科研与生产管理用的较多的功能是SAS软件的强大的统计分析功能,例如用于多变量分析的PRINCOMP(主成分分析)、FACTOR(因子分析)、CANCORR(典型相关分析)、PRINQUAL(定性数据的主成分分析)和CORRESP(对应分析);用于判别分析的CANDIS(典型判别)和STEPDISC(逐步判别);以及用于聚类分析的CLUSTER(谱系聚类)、FASTCLUS(K均值快速聚类)、MODECLUS(非参数聚类)、VARCLUS(变量聚类)和TREE(画谱系聚类的结果谱系图并给出分类结果)等。
第一,功能强大,统计方法新颖和齐全。SAS提供了从基本统计数的计算到各种试验设计的方差分析,相关回归分析以及多变数分析的多种统计分析过程,几乎囊括了所有最新分析方法,其分析技术先进,可靠。分析方法的实现通过过程调用完成。许多过程同时提供了多种算法和选项。
第二,使用简便,操作灵活。SAS以一个通用的数据DATA步产生数据集,然后以PROC步调用完成各种数据分析。其编程语句简洁,短小,通常只需很小的几句语句即可完成一些复杂的运算,得到满意的结果。结果输出统计术语规范易懂。在使用过程中,用户只需告诉SAS“做什么”,而不必告诉其“怎么做”。同时SAS软件的纠错能力很强,例如将DATA语句的DATA拼写成DATE,SAS将假设为DATA继续运行,仅在LOG中给出注释说明,运行时的错误它尽可能地给出错误原因及改正方法。
第三,处理数据类型丰富多样,SAS软件可以处理任意类型和格式的数据。DATA步的设计纯粹就是为了数据的管理,所以SAS擅长处理数据,利用丰富的选项,SAS可以将大数据处理的很好,拼表和PROC SQL也可以减少运行时间。
第四,提供联机帮助功能。使用过程中按下功能键F1,可随时获得帮助信息,得到简明的操作指导。

适宜的统计软件能够帮助企业管理者在处理和分析大样本生产数据过程中发挥重要作用。本期公众号首先向读者介绍了SAS软件,下期我们将为大家介绍SPSS软件,敬请大家期待。

微信号:Friend_IT

