打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
TCGA的样本id里藏着分组信息

 今天是生信星球陪你的第291天


   大神一句话,菜鸟跑半年。我不是大神,但我可以缩短你走弯路的半年~

   就像歌儿唱的那样,如果你不知道该往哪儿走,就留在这学点生信好不好~

   这里有豆豆和花花的学习历程,从新手到进阶,生信路上有你有我!

用R语言解决一下TCGA的小问题。


图中展示的是TCGA样本id,分组信息是在这个id的第14-15位,01-09是tumor,10-29是normal。我拿了一个示例数据,请在生信星球公众号回复0129获取。
根据这个生成一个分组信息它是一个向量形如

如果在id的14-15位在1-9之间就标记tumor,10-29之间就标记normal。这里面涉及到字符串截取、数据类型转换,%in%函数以及ifelse函数(if-else循环的变体)
将示例数据放到你的工作目录

load(file='id.Rdata')
table(substring(id,14,15)) #table看有多少重复值
num <- as.numeric(substring(id,14,15)) #截取出来是字符串,要转为数字
#屡试不爽的ifelse
group_list=ifelse(num %in1:9,'Tumor','Normal')

如果你要用自己的数据试试,就把样本编号命名为id,来跑一跑就ok。这一列信息后面作图会用。

非常开心公众号粉丝到了2000
最近忙于毕业论文,为了不断更中午不休息了,上班时间继续写论文,豆花在加油。

简书:小洁忘了怎么分身

隔壁生信技能树公益视频合辑(学习顺序是linux,r,软件安装,geo,小技巧,ngs组学!)

国内看B站,教学视频链接:https://m.bilibili.com/space/338686099 
国外看YouTube,教学视频链接:https://m.youtube.com/channel/UC67sImqK7V8tSWHMG8azIVA/playlists 

友情链接:

生信工程师入门最佳指南
学徒培养

资料大全


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
TCGAbiolinks的甲基化数据分析
TCGA 甲基化芯片数据下载和整理
PCA都分不开的两个组强行找差异是为何
batchType报错
TCGA学习01:数据下载与整理
哦别做梦了!
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服