打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
NHANES教程01.数据下载实操,绝对干货!建议收藏!
userphoto

2022.05.28 广东

关注
生信论文发表的难度越来越大,纯生信的机会越来越少!对于错过纯生信红利、又无法开展湿实验或不会单细胞技能,而又需要文章的人,更难了!我们认为,如果没有实验条件或者对基础科研、生信分析不感冒,借助公共数据平台如NHANES等发表临床研究的论文也是个不错的方向。事实上,很多人已经用NHANES发文章毕业或晋升,有人甚至2年能发10篇临床研究。
网址:https://www.cdc.gov/nchs/nhanes/index.htm

在网站首页,进入Publications and Products,我们可以进行交互式数据可视化展示,数据简报,电子病例等。比如,我们进入数据可视化页面的数据。这些数据代表了从1999-2000年到2017-2018年国家健康和营养检查调查 (NHANES) 的估计值。

虽然NHANES数据库自带分析功能并以线图、bar图和表等展示数据,但是并不能满足我们发表论文的需求。因此,我们需要学会数据的下载和处理。当然,如何把数据库数据转化为论文,还要通过相关医学文献的阅读来实现。今天我们分享NHANES数据的下载和初步处理。

在NHANES数据库官网首页,点击左栏的NHANES Questionnaires, Datasets, and Related Documentation,进入调查表、数据集和相关文档。待下载的数据在Continuous NHANES选项里面。这些数据是按照年份进行上传和保存的。

下载方法(一)网页下载后R读取

比如,我们选取2017-2018年的数据进行下载。点击选择左栏选项中的NHANES 2017-2018或右侧Continuous NHANES里面的NHANES 2017-2018。然后页面自动跳转到2017-2018数据页面。数据内容包括四部分:①数据、文档和密码文件,包含人口统计资料、饮食数据、检查资料、实验室资料、问卷表和有限访问的数据;②详细资料,包括问卷工具、实验方法、程序手册以及小册子和知情同意文件;③使用数据,包括概述、发行说明、实验室数据概览、检查资料概览、问卷数据概览、调查途径和数据分析指南、回应率和人口统计,网站还提供了网络教程。④内容概览,主要是常见问题的汇总等。

点击要下载的数据文件,选择存储位置,点击下载。我们以Demographics Data为例。选择Data File下面的DEMO_J_ Data进行下载(Doc_File是对访问资料的介绍,无需下载)。文件类型是.XPT,下载时对网速有要求。下载后数据可用统计软件SPSS等打开,或者用R也可以。

数据下载后,我们用R将数据展示出来。

library(foreign)library(Hmisc)Mydata <- read.xport('DEMO_J.XPT')

或者用R进行数据转换。

####----data_upload_and_transform----####install.packages('haven')library(haven)Mydata <- read_xpt('F:/NHANES/DEMO/DEMO_J.XPT')

上述方式操作步骤有些繁琐,适用于不能用R下载的数据。

下载方法(二)通过R函数或NHANES包下载数据

####----Download_data_from_NHANES by R functions----####library(dplyr)downloadNHANES <- function(fileprefix){ print (fileprefix) outdf <- data.frame(NULL) for (j in 1:length(letters)){ urlstring <- paste('https://wwwn.cdc.gov/nchs/nhanes/',yrs[j],'/',fileprefix,letters[j],'.XPT', sep='') download.file(urlstring, tf <- tempfile(), mode='wb') tmpframe <- foreign::read.xport(tf) outdf <- bind_rows(outdf, tmpframe) } return(outdf) }
yrs <- c('2013-2014') ##years by yourselfletters <- c('_H') ##updated by the online data DEMO2013<- downloadNHANES('DEMO') ##download datawrite.csv(DEMO_H, 'F:/NHANES/data/DEMO_H.csv')
yrs <- c('2003-2004') letters <- c('_C') DEMO2013<- downloadNHANES('DEMO') write.csv(DEMO2013, 'F:/NHANES/data/DEMO_C.csv')

更好的下载方法是,有生信前辈写好了NHANES的R包,用于数据下载。感谢!

####----Download_data_from_NHANES by NHANES----####install.packages('RNHANES')library(RNHANES)DEMO20132014<- nhanes_load_data('DEMO_H', '2013-2014', destination = 'F:/NHANES/data')DEMO20032004<- nhanes_load_data('DEMO_C''2003-2004', destination = 'F:/NHANES/data')

本推文根据临床科学家、月明学习小铺、公卫科研素养促进计划、科研杂录、科研侠和丁香园等公众号,仅用于学术交流,特此感谢。如有侵权,请联系洽谈合作或删除。

本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
手把手教你在NHANES库里下临床数据
NHANES数据结构
R语言 | 第三讲:R语言数据的导入与导出
提取NHANESIII数据详解
(实用篇)PHP按行读取、处理较大CSV文件的代码实例
Linux命令行,菜鸟报错之隐藏在换行中的字符^M
更多类似文章 >>
生活服务
分享 收藏 导长图 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服