
课程基本信息
标题:《R语言实战》
课程周期:4天
上课方式:现场+远程
上课时间:2016年3月26-27日、4月2-3日
备注:提供课程讲义和全部代码、上课视频,以及赠送R进阶视频课程《R语言实践》
学习目标:
本课程结合大量的案例,让学习者可以快速掌握数据分析技能,并利用R实现各种数据挖掘模型的建立。学习完本课程,学习者能达到以下目标:
1)掌握用R进行数据处理的能力;
2)用R进行描述性统计分析和数据图形化;
3)缺失值的清洗能力;
4)用R语言建立数据挖掘模型;
5)用R实现爬虫技术,用R搭建自己的app等核心技能。
学习对象:
数据分析师、数据科学家;
商业智能(BI)和企业数据仓库(EDW)的管理人员、建模人员、分析和开发人员、系统管理员等;
想了解和学习数据分析和数据挖掘实战的朋友。
课程安排
Day 1:R概述与基本操作
1) R语言介绍
2) 数据结构
3) 数据的导入导出
4) 基本数据管理
5) 控制流
Day 2:基础统计与统计绘图
1) 描述统计量
2) 描述性统计分析
3) R语言的绘图基础
4) 低级绘图函数
5) 高级绘图函数
Day 3:统计模型
1) 一元线性回归模型
案例:对women数据集进行线性回归建模
2) 多元线性回归模型:模型实现、模型检验、变量选择
案例:以state.x77数据集为例,探究一个州的犯罪率和其他因素的关系
3) logit回归模型
4) 降维技术:主成分分析、因子分析、对应分析
案例一:对调研的中学生身体指标进行主成分分析
案例二:利用主成分分析构建股票市场指数
案例三:对洛杉矶街区数据进行因子分析
5) 聚类分析
案例一:对iris数据集进行 k-means、k-medoids聚类
案例二:对洛杉矶街区数据进行层次聚类
6) 关联规则分析
案例:利用超市购物篮Groceries数据进行关联规则分析
Day 4:数据挖掘与文本挖掘
1) 使用最近邻近法分类
案例一:对iris数据集进行knn分类
案例二:对wisc_bc_data数据集进行knn分类
2) 朴素贝叶斯分类
案例一:对数据集PimaIndiansDiabetes进行分类;
案例二:利用朴素贝叶斯分类对文本数据进行分类;
3) 应用决策树进行分类
案例:对iris数据集进行C4.5、C5.0、CART等决策树分类
4) 神经网络及支持向量机
案例一:利用神经网络对 Vehicle数据进行分析
案例二:利用支持向量机对cats数据集进行分析,将尝试使用体重和心脏重量来预测一只猫的性别。
5) 文本挖掘
案例:对推特数据进行文本挖掘
讲师介绍:
谢佳标
从事数据分析挖掘工作超过8年,从事过咨询、电商、电购、电力、游戏等行业,了解不同领域
的数据特点。精通Excel、SpssClementine、SAS、R等多种数据分析挖掘工具。目前就职于一
家上市游戏公司的高级数据分析师,主要利用R语言进行大数据的分析挖掘工作。有丰富的利用
R语言进行数据分析挖掘实战经验,部分研究成果曾获得国家专利。
联系方式:
联系电话:400-070-7620
联系QQ:149104196

