近年来基因组测序技术出现了迅猛的发展,测序通量在不断地提高,而测序成本在持续下降。然而,海量测序数据的产生也给数据分析带来了不小的挑战。
对于那些毫无编程背景的生物学研究者来说,衔接多个生物信息学工具是一件相当头疼的事情。加州大学、Broad研究所和斯坦福大学的研究团队日前在Nature Methods杂志上发布了GenomeSpace。这是一个关联了二十多种生物信息学软件包和资源,让基因组数据分析显得异常简单。以便编程菜鸟们更好的解读基因组数据。
“新测序技术生成的数据比十年前多得多,数据分析方法也应当变得更加强大,”文章通讯作者Jill Mesirov教授说。“目前只有少数生物医学团队具备足够的专业知识,将正确方法和最佳途径用于自己的数据,并由此解决自己的研究问题。”
让多个分析工具一同工作,需要编写转换和传递数据的短程序,研究者没有一点编程技能是搞不定的。GenomeSpace平台以用户友好界面做到了软件的无缝衔接,包括常用的基因组数据分析工具,比如Cytoscape、Galaxy、GenePattern和Integrative Genomics Viewer (IGV)。由于其中一些工具本身就整合了其他工具,GenomeSpace实际上为人们提供了数百种生物信息学分析。
此外,GenomeSpace还为指引用户以正确的顺序使用工具,从原始数据中提取自己想要的信息。GenomeSpace目前提供有13个方式,平台开发者正在邀请开发者贡献更多的解决方案。
GenomeSpace究竟怎么用。如果想了解白血病干细胞与正常白细胞前体之间差异性表达的基因,以及这些基因背后的生物学机制。只需要在GenomeSpace中简单上传基因表达数据和其它相关信息,然后照着GenomeSpace为这类问题特别制定的操作,用GenomeSpace中的两个工具处理数据。GenePattern会给出这两种细胞之间表达差异最大的50个基因,Cytoscape则分析这些基因的相关蛋白如何在网络中相互作用,揭示肿瘤或正常细胞特异性基因的作用。GenomeSpace提供的这些信息,可以帮助研究者们更好的理解白血病发展,鉴定潜在的新治疗靶标。
联系客服