打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
【原创】寻找基因的CDS, 5'UTR,3'UTR及Promoter区等

由于实验需要,最近看了很多这方面的资料,这里做个汇总。首先看下摘自WIKI的这张图有个大概的了解。



一、CDS,5'UTR 和3'UTR的寻找

由上图可知,5'UTR 和3'UTR虽然是基因上不被翻译的区域,但他们本身属于Exon,因此找出他们的序列很简单。如我现在要寻找humanLDLR(人源低密度脂蛋白受体)这个基因的5’UTR及3'UTR,我直接在NCBI的GENE里面输入LDLR,然后找human的这个GENE,显示如下:



看到这个页面后,下拉寻找LDLR的mRNA序列信息点击下图的NM_000527.4,便可得到LDLR的mRNA全序列。



看到Homosapiens low density lipoprotein receptor (LDLR), transcript variant1,mRNA后,往下拉菜单,会发现CDS的信息,直接点击CDS,下方的CDS序列则被深红标出,而CDS前面180多bp则为LDLR的5’UTR,而CDS后面2000多bp的则为LDLR的3‘UTR:



 

二、promoter区域

promoter怎么找?这个比较复杂,目前没找到一个软件或者网站可以精准的找到一个基因的promoter区。但是promoter本身其实就是转录起始点前的一段序列,也可以说是5’UTR上游的可以几百bp,也可以上千bp,但一般不会超过上游2000bp,有几个网站可以帮助寻找。

1.http://www.mybioinfo.info/ 这个网站极简单,但搜索范围也很大,可以找到5’上游10KB,甚至100KB。只有填入基因的缩写名称和来源就行,比如LDLRhuman,然后search就列出一堆来,可以看到Promoter Genomic Refseq (5' up-stream 10kb) 甚至Promoter Genomic Refseq (5' up-stream 100kb)。下载下来的格式就是FASTA了,极快无比。

2.http://rulai.cshl.edu/cgi-bin/TRED/tred.cgi?process=home 这个是冷泉港的一个数据库,专门用来查找基因的转录调节元素(TranscriptionalRegulatory ElementDatabase )。左边有个RetrievePromoters,点击进入,输入基因缩写如 LDLR,染色体号,如19,便可得到Promoter的信息。这里面显示了5'上游700的数据,和转录起始点开始300bp的数据,总共1000bp。但也可以自己调节位置,如我想知道-1000bp到0的就在右下角更改,再refresh就可以了。如图红色圈圈显示:


对这个结果我在软件DNA MAN NCBI上 RUN BLAST来确认,结果显示是Accession number为 FJ525879.1 的一段序列。但FJ525879.1 竟然显示的是LDLRcomplete CDS区,我就直接晕倒了,promoter怎么会在CDS区?而且这个LDLRCDS区怎么会有40000多bp那么长?难道NCBI也有错误的数据?!所以,基于这个不能解释的问题,我暂时不推荐用这个数据库。。。可能是我没研究彻底,欢迎来指正。

3.介绍个更靠铺的吧,UCSD的。http://genome.ucsc.edu/
UCSD这个有一个帖子专门介绍如何使用,点击页面左上角的Genomebrower,然后进入基因信息输入页面。还是以LDLR为例。


 点击submit就可以得到一系列LDLR的信息:

Ensembl Gene Predictions路径由Ensembl提供。若初次尝试得不到Ensembl,则可下拉菜单将Ensembl Genes选择为dense full模式,点击Refresh。如果可以得到以上的图,我们便可以直接点击EnsemblGenes里面第一个红色条带,便得到下面的信息:


 点击 Genome Sequence from assembly,便得到以下重要信息:


promoter, 5'UTR, CDS, 3'UTR, INTRONS啥都出来了,想要啥就打啥勾submit就行了。promoter的话,5’上游2000bp应该够了,这个结果我blast过,是对的。


好吧,先记录到这里吧,应该会有很多方法来寻找的,欢迎指正补充哈~~~另外,推荐一个不错的网站:叫biologyonline,有什么问题可以发上去,会有人回复的,前提是这是个英文网站,so,ask questions byEnglish!~

http://www.biology-online.org/biology-forum/about10668.html


DR.J

2012.7.13










本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
查找一个基因的启动子序列
一文教会你查找基因的启动子、UTR、TSS等区域以及预测转录因子结合位点
基因3'-UTR序列下载
轻松学会寻找 crisprcas9 目的基因 CDS 序列
一个萤火虫荧光素酶基因竟然有这么多种用法
TBtools | 地球最友好的 GFF3/GTF 序列提取工具
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服