对于很多医学研究人员来说,R语言貌似不错,但很令人头大,高级R包里面的语言较为复杂,连模仿都做不到,怎么办?
本人一向认为,学习R语言不能心急,一口吃不了胖子,而且还会噎着。R语言太多的细节了,你学三天就已经放弃了。没错,我断断续续学习了十多年,也没有精通R语言。
R语言网上有很多视频和材料,纵观视频,有这么感觉:R语言的教程,第一,太琐碎且无目的性,无法围绕一个研究目的进行,感觉学了也不知道有什么用。第二,大多数是秀技术的,希望给你展示精美的图片、高级的方法,似乎你不学习就不能做统计分析了;第三,不针对医学。其实医学群体人群的研究有其特点,统计学方法也可以很简单。第四,举的例子都是各种包自带,每次例子都五花八门,变量名也尤其复杂(对不对!),到最后也无法形成一份完整的报告。
医学数据,说简单很简单,两组数据做个t检验即可;复杂的也有,比如生物信息数据分析,当然我不认为这是医学研究。更多的是,做个回归,带个美图,至多做个流行的列线图即可。
但是,学习统计方法,最好是围绕着一个案例,系统性地介绍统计分析的全部过程。统计是为医学研究服务的,而不是为学统计而统计。
所以,系列“30天学会R语言”就是朝着医学数据分析的目的去。我们的分析目的,是围绕一个综合案例,撰写一篇医学论文。我想只要简单的坚持就能成功,这样的坚持不难。
1. 医学数据分析的工作内容
上述统计内容,对应的R语言,也没有非常复杂的包、命令要去学习,初学者只要学习上述内容的枝干即可。
2. 30天学会R语言的学习内容
根据医学数据分析的目的,我把R语言学习分为以下部分:
基本篇(R语言基本介绍)
数据整理和图形篇
数据分析篇
结果报告篇
整个过程下来,我们通过相对简单的R语言帮助实现撰写典型的医学及相近学科定量研究论文的目的。从而帮助各位习得基本R语言数据分析方法。
3. 我们的案例
案例是一项调查研究。该调查老年人的健康水平,除了一般的基本情况,健康行为,还包括生命质量水平;此外,该人群还有一批健康体检的指标,包括血压、血糖、血脂、骨密度等。
具体如下:
个人基本情况:性别、年龄、户籍、婚姻、教育程度、收入
健康行为:吸烟、饮酒、锻炼、睡眠质量、是否失眠
健康:自评健康(定量),欧洲生命质量表评分(5项)
健康体检指标:收缩压、舒张压、血糖、总胆固醇、低密度脂蛋白、高密度脂蛋白、甘油三酯、血尿酸、骨密度
联系客服