由于实验需要,最近看了很多这方面的资料,这里做个汇总。首先看下摘自WIKI的这张图有个大概的了解。
一、CDS,5'UTR 和3'UTR的寻找
由上图可知,5'UTR 和3'UTR虽然是基因上不被翻译的区域,但他们本身属于Exon,因此找出他们的序列很简单。如我现在要寻找humanLDLR(人源低密度脂蛋白受体)这个基因的5’UTR及3'UTR,我直接在NCBI的GENE里面输入LDLR,然后找human的这个GENE,显示如下:
看到这个页面后,下拉寻找LDLR的mRNA序列信息点击下图的NM_000527.4,便可得到LDLR的mRNA全序列。
看到Homosapiens low density lipoprotein receptor (LDLR), transcript variant1,mRNA后,往下拉菜单,会发现CDS的信息,直接点击CDS,下方的CDS序列则被深红标出,而CDS前面180多bp则为LDLR的5’UTR,而CDS后面2000多bp的则为LDLR的3‘UTR:
Ensembl Gene Predictions路径由Ensembl提供。若初次尝试得不到Ensembl,则可下拉菜单将Ensembl Genes选择为dense
promoter, 5'UTR, CDS, 3'UTR, INTRONS啥都出来了,想要啥就打啥勾submit就行了。promoter的话,5’上游2000bp应该够了,这个结果我blast过,是对的。
好吧,先记录到这里吧,应该会有很多方法来寻找的,欢迎指正补充哈~~~另外,推荐一个不错的网站:叫biologyonline,有什么问题可以发上去,会有人回复的,前提是这是个英文网站,so,ask questions byEnglish!~
http://www.biology-online.org/biology-forum/about10668.html
DR.J
2012.7.13
联系客服