目前,Python在数据分析和交互、探索性计算以及数据可视化等方面都显得比较活跃,由于其易用、可拓展、免费、开源等诸多特性,越来越多人开始使用Python进行计量。本次将简单介绍Python中常用于计量分析的第三方库statsmodels。
statsmodels是一个Python模块,它提供了用于估计许多不同统计模型的类和函数,以及用于进行统计测试和统计数据探索。statsmodels支持使用R语言风格的公式和pandas数据流来指定模型
下面是一个使用普通最小二乘法的简单例子:
除了上示的R语言风格公式之外,statsmodels也支持用numpy数组进行拟合。
基本上大多数的计量模型都可以用上示类似代码实现,可以说非常方便了。statsmodels支持绝大多数常用的计量模型。
库的接口如下:
statsmodels.api:
横截面模型.,常规导入方法:
import statsmodels.api as sm.
statsmodels.tsa.api:
时间序列模型,导入方法:
import statsmodels.tsa.api as tsa.
statsmodels.formula.api:
使用字符串和DataFrame的一个模型简易接口。导入方法:
import statsmodels.formula.api as smf
详情请访问
http://www.statsmodels.org/stable/index.html
参考文献
Seabold, Skipper, and Josef Perktold. “statsmodels: Econometric and statistical modeling with python.” Proceedings of the 9th Python in Science Conference. 2010.
—责编:曾德涛—
—推送:张涵—

