欢迎来到医科研,这里是白介素2的读书笔记,跟我一起聊临床与科研的故事, 生物医学数据挖掘,R语言,TCGA、GEO, SEER数据挖掘。
作者:白介素2
继续坚持阻击疫情,从我做起,坚持原地不动。读读文献,分享给大家。
对于没有接触过数据挖掘,生物信息数据的生物医学研究人员、学生而言,让他们从头去找数据,开辟新的研究方向是无比艰巨的;面临的第一个问题就是不知道有哪些数据,去哪里找数据?当然还有接下来的其它问题,如何下载数据?数据结构如何?如何分析数据?
当然了,冰冻三尺,非一日之寒;我们今天首先解决一个问题,勾勒一个大概的轮廓;对数据资源有一个大体的了解。
今天读的文献是一篇 review article,告诉大家想做数据挖掘,数据哪里找。要想挖掘数据,首先要有数据积累,近年来生物信息数据挖掘越来越火爆的原因正是芯片、测序数据的成熟,以及大型研究项目数据库的数据资源积累;包括最近的前沿热点单细胞测序数据。
· 我们必须要知道自己生活在“大数据”时代,这推动了在“精准医学”领域已经取得的许多突破,并将支撑到大部分治疗和预防进展。数据可以由很多方式产生的:比如由个体研究人员/实验室,由主办和可能管理数据的,国家项目,例如著名的癌症基因组图谱 TCGA。
Nucleic Acids Research杂志每年都会发布数据库专刊,包括新开发的数据库及大型数据库的更新,比如
National Center for Biotechnology Information (NCBI), Swiss Institute of Bioinformatics, European Bioinformatics Institute;and the DNA Data Bank of Japan。
https://www.hsls.pitt.edu/obrc/ 划重点,奉上网址
由University of Pittsburgh Health Sciences Library System维护的专门收集生物信息网络资源的网址,可谓数据库收集之集大成者。
!1580304983563](pData\Roaming\Typora\typora-user-images\1580304983563.png)
2020的春节注定是一段镌骨铭心的时间,此时此刻我的很多师长、师兄师姐们正奋战在抗击疫情的最前沿,他们勇敢逆行,一往无前;我想向你们致敬,但我不想称你们为天使,我知道你们只是负重前行的普通人。愿我的祖国早日战胜疫情,愿你们都平安,为你们祈祷。
春节前,我给杂志主编回信时加了一句我们正在过中国传统春节假期,祝他新年快乐。今天他回复我说Happy New Year and all the best in the year of the rat! But terrible that it had such a rocky start, we will pray for the people who have been exposed to the virus. 你们看,其实我们都在祈祷。
本期内容就到这里,我是白介素2,下期再见,点击下方框框留言。
联系客服