打开APP
未登录
开通VIP,畅享免费电子书等14项超值服
开通VIP
首页
好书
留言交流
下载APP
联系客服
R语言合并TCGA中CNV矩阵
生信交流平台
>《待分类》
2022.10.19 上海
关注
上一期给大家介绍了如何从TCGA数据库下载拷贝数变异
(CN
V
)
数据
☞
如何下载TCGA拷贝数变异(CNV)数据
今天我们来聊一聊如何将每一样本的CNV数据,合并成一个矩阵,方便后续的处理和分析。前面小编已经跟大家介绍过
☞
R代码合并新版TCGA数据库RNAseq表达谱数据
☞
零代码合并新版TCGA数据库RNAseq表达谱数据
☞
R代码合并TCGA体细胞突变数据
☞
R代码合并TCGA数据库中DNA甲基化数据
☞
合并TCGA表达谱数据,生存状态和生存时间
其实合并CNV数据的思路跟前面
☞
R代码合并新版TCGA数据库RNAseq表达谱数据
的思路是一致的。
在正式合并之前,我们先打开一个样本的CNV数据看看,是什么样的格式。
第一列是基因的Ensembl基因ID,第二列是对应的基因名字,第3-5列为该基因在染色体上的位置。第6-8列为该基因的拷贝数。我们知道人是二倍体,一般来说一个基因2个拷贝是正常的,如果>2,那么就发生了拷贝数增加,如果<2,那么就发生了拷贝数减少。
对于TCGA-CHOL这个项目,我们一共有36个样本。所以我们需要先从下载的sample sheet文件中获取每个样本CNV文件的路径和名字。下图就是我们的sample sheet,前两列分别为存放CNV文件的文件夹的名字,和CNV文件的名字。
然后通过循环依次去读取这36个文件中的信息,最终按列合并起来得到最后的CNV矩阵。如下表所示,每一行是一个基因,每一列是一个样本。格子里的数字代表这个基因在这个样本里的拷贝数。
本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请
点击举报
。
打开APP,阅读全文并永久保存
查看更多类似文章
猜你喜欢
类似文章
【热】
打开小程序,算一算2024你的财运
小样本多组学分析怎么发12分的Nature子刊?
TCGA官方数据挖掘文章教你机器学习or深度学习
新年迎财神的正确方式
TCGA数据库33种癌症临床数据、mRNA表达矩阵全部下载,可直接获取矩阵
TCGA差异分析~包教包会
TCGA临床数据mRNA矩阵lncRNA矩阵miRNA矩阵文件整理
更多类似文章 >>
生活服务
热点新闻
留言交流
回顶部
联系我们
分享
收藏
点击这里,查看已保存的文章
导长图
关注
一键复制
下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!
联系客服
微信登录中...
请勿关闭此页面
先别划走!
送你5元优惠券,购买VIP限时立减!
5
元
优惠券
优惠券还有
10:00
过期
马上使用
×