R是统计领域广泛使用的工具,属于GNU系统的一个自由、免费、源代码开放的软件,是用于统计计算和统计绘图的优秀工具。
下面我们将分享《R语言实战》中的第1-16章的学习笔记汇总,由浅入深学习R的基本安装中最重要的函数,以及一些重要扩展包中的函数,从而用各种技术实现数据的可视化,解决各种难度的数据分析问题。
首先介绍了如何获取和安装R,通过简单的示例熟悉R的用户界面,运行R程序,学习了如何从在线免费下载扩展(称为用户贡献包)来增强基本安装的功能。
介绍了R中用于存储数据的多种数据结构,以及从键盘和外部来源导入数据的许多可能方式,为实现R的数据处理功能做准备。
介绍了R中处理图形的一般方法,包括图形的创建和保存、修改图形的特征(标题、坐标轴、标签、颜色、线条、符号和文本标注)以及组合多幅图形为单幅图形的各种方法。
介绍了R中基本的数据集处理方法,将数据转换或修改为更有助于分析的形式。
介绍了R中用于创建和转换变量的算术函数、字符处理函数和统计函数,学习了使用控制流来完成数据处理和分析任务,以及折叠、整合以及重构数据的多种方法。
介绍了可视化单个类别型或连续性变量分布的方法,探索条形图、饼图、扇形图、直方图、核密度图、箱线图、小提 琴图和点图的用法。
介绍了R中用于生成统计概要和进行假设检验的函数。包括样本统计量和频数表、独立性检验和类别型变量的相关性度量、定量变量的相关系数(和连带的显著性检验)以及两组或更多组定量结果变量的比较。
表7-1 用于创建和处理列联表的函数
介绍了R中实现回归分析的各个步骤,包括拟合模型、检验统计假设、修正数据和模型,以及为达到最终结果的再拟合等过程。
通过组内和组间设计的示例介绍了如何对类别型预测变量进行方差分析以及假设检验。
学习了使用pwr包中的函数对常见的统计方法(包括t检验、卡方检验、比例检验、ANOVA和回归)进行功效和样本量的计算。
介绍了用于展示双变量间关系(二元关系)和多变量间关系(多元关系)的绘图方法,包括二维和三维散点图、散点图矩阵、气泡图、折线图、相关系数图和马赛克图。
介绍了当数据抽样于未知或混合分布、样本量过小等等情况时,常用的两种应用广泛的依据随机化思想的统计方法:置换检验和自助法。
介绍了如何使用glm()函数来进行估计广义线性模型,重点关注该框架中两种流行的模型:Logistic回归(因变量为类别型)和泊松回归(因变量为 计数型)。
介绍了两种用来探索和简化多变量复杂关系的常用方法,主成分分析(PCA)和探索性因子分析(EFA)两种方法的模型和分析步骤。
介绍了如何在R中生成时间序列、判断序列中是否存在某种趋势或季节性因素,并探讨了最常用的两种预测手段,即指数模型和ARIMA模型。
介绍了常见聚类分析的一般步骤,描述了层次聚类和划分聚类的常见方法,以及验证不存在的类。
联系客服