
在网站首页,进入Publications and Products,我们可以进行交互式数据可视化展示,数据简报,电子病例等。比如,我们进入数据可视化页面的数据。这些数据代表了从1999-2000年到2017-2018年国家健康和营养检查调查 (NHANES) 的估计值。

虽然NHANES数据库自带分析功能并以线图、bar图和表等展示数据,但是并不能满足我们发表论文的需求。因此,我们需要学会数据的下载和处理。当然,如何把数据库数据转化为论文,还要通过相关医学文献的阅读来实现。今天我们分享NHANES数据的下载和初步处理。

在NHANES数据库官网首页,点击左栏的NHANES Questionnaires, Datasets, and Related Documentation,进入调查表、数据集和相关文档。待下载的数据在Continuous NHANES选项里面。这些数据是按照年份进行上传和保存的。
下载方法(一)网页下载后R读取

比如,我们选取2017-2018年的数据进行下载。点击选择左栏选项中的NHANES 2017-2018或右侧Continuous NHANES里面的NHANES 2017-2018。然后页面自动跳转到2017-2018数据页面。数据内容包括四部分:①数据、文档和密码文件,包含人口统计资料、饮食数据、检查资料、实验室资料、问卷表和有限访问的数据;②详细资料,包括问卷工具、实验方法、程序手册以及小册子和知情同意文件;③使用数据,包括概述、发行说明、实验室数据概览、检查资料概览、问卷数据概览、调查途径和数据分析指南、回应率和人口统计,网站还提供了网络教程。④内容概览,主要是常见问题的汇总等。

点击要下载的数据文件,选择存储位置,点击下载。我们以Demographics Data为例。选择Data File下面的DEMO_J_ Data进行下载(Doc_File是对访问资料的介绍,无需下载)。文件类型是.XPT,下载时对网速有要求。下载后数据可用统计软件SPSS等打开,或者用R也可以。

数据下载后,我们用R将数据展示出来。
library(foreign)library(Hmisc)Mydata <- read.xport('DEMO_J.XPT')或者用R进行数据转换。
####----data_upload_and_transform----####install.packages('haven')library(haven)Mydata <- read_xpt('F:/NHANES/DEMO/DEMO_J.XPT')
上述方式操作步骤有些繁琐,适用于不能用R下载的数据。
下载方法(二)通过R函数或NHANES包下载数据
####----Download_data_from_NHANES by R functions----####library(dplyr)downloadNHANES <- function(fileprefix){ print (fileprefix) outdf <- data.frame(NULL) for (j in 1:length(letters)){ urlstring <- paste('https://wwwn.cdc.gov/nchs/nhanes/',yrs[j],'/',fileprefix,letters[j],'.XPT', sep='') download.file(urlstring, tf <- tempfile(), mode='wb') tmpframe <- foreign::read.xport(tf) outdf <- bind_rows(outdf, tmpframe) } return(outdf) }
yrs <- c('2013-2014') ##years by yourselfletters <- c('_H') ##updated by the online data DEMO2013<- downloadNHANES('DEMO') ##download datawrite.csv(DEMO_H, 'F:/NHANES/data/DEMO_H.csv')
yrs <- c('2003-2004') letters <- c('_C') DEMO2013<- downloadNHANES('DEMO') write.csv(DEMO2013, 'F:/NHANES/data/DEMO_C.csv')更好的下载方法是,有生信前辈写好了NHANES的R包,用于数据下载。感谢!
####----Download_data_from_NHANES by NHANES----####install.packages('RNHANES')library(RNHANES)DEMO20132014<- nhanes_load_data('DEMO_H', '2013-2014', destination = 'F:/NHANES/data')DEMO20032004<- nhanes_load_data('DEMO_C', '2003-2004', destination = 'F:/NHANES/data')
本推文根据临床科学家、月明学习小铺、公卫科研素养促进计划、科研杂录、科研侠和丁香园等公众号,仅用于学术交流,特此感谢。如有侵权,请联系洽谈合作或删除。