打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
那些转录因子相关数据库及如何预测转录因子结合位点?

我们知道,大多数真核生物的基因都是不连续的,即基因的编码序列在DNA分子上是不连续的,被非编码序列隔开。但真核生物基因在无转录因子时处于不表达状态,因为RNA聚合酶自身无法启动基因的转录,只有当转录因子(transcriptionfactor, TF, 一种蛋白质)结合到其识别的DNA序列上后,基因才开始表达。首先我们要看,啥是转录因子呢?

转录因子就是能结合在基因的启动子区域,可以启动基因表达,或者操纵基因表达,或者,应该有的可能会堵在前面阻碍基因表达的。

当然,在序列上转录因子不光会结合启动子区,还会结合在Enhancer,也就是促进子之类的元件上。

说简单点,就是转录因子,就是一种能结合在DNA上的蛋白。

于是就产生了这样的技术,用抗体固定在大珠子上,然后把转录因子的蛋白质沉淀下来。沉淀的过程中,把染色质的DNA消化成片段,这样就能顺带着转录因子,把它结合的DNA序列拉下来了,这个就是ChIP,染色质免疫共沉淀。

而这里就涉及到另外一个概念,即转录因子结合位点(transcription factor binding site, TFBS), 它是转录因子调控基因表达时,与DNA上一段特殊的核苷酸序列相结合的区域,这段区域就称为启动子(Promoters),位于基因的调控区。

华丽丽的分割线

在上一篇文章中,我们分享了如何寻找目的基因启动子序列(点我查看上篇帖子),那么接下来我们就要介绍一些转录因子相关的数据库及预测转录因子结合位点的问题了。

TRANSFAC数据库

http://www.generegulation.com

TRANSFAC数据库是基于真核生物转录调控所建立的数据库,由BIOBASE公司负责日常更新和维护工作,其中收集了大量与基因转录水平有关的数据,如转录因子及其DNA结合位点和相应的靶基因等信息。该数据库分为公开版本和专业版本两个部分,用户只需登陆该网站,按照要求完成相应的注册,利用所获得的账号可以免费查询公开版本中所有的信息,而专业版本则需要用户付费使用。

网站登陆进去是长这个样子的……上面会有个提示你付费的链接。

JASPAR 数据库

http://jaspar.genereg.net/cgi-bin/jaspar_db.pl

JASPAR数据库是收集有关转录因子与DNA结合位点模体的最全面的公开的数据库,该数据库是由哥本哈根大学负责其日常数据更新和维护工作,其中所包含的数据,都经过严格筛选,有确切的实验依据,通过计算机辅助软件进行整合识别匹配并用生物学手段进行注释。

其中,JASPAR 核心数据库JASPAR_CORE 不仅增加了CHIP-CHIP和CHIP-seq相关的信息,与配体DNA系统进化指数富集技术(DNASystematic Evolution of Ligands by Exponential Enrichment, DNA SELEX)相比,提供了更加丰富和准确的信息用于基因研究中,还增加了关于蛋白结合微阵列技术(Proteinbinding microarray, PBM)相关的3个子数据库。

TRRD 数据库 

http://www.mgs.bionet.nsc.ru/mgs/gnw/trrd/

TRRD是转录调控区数据库,收集了基因转录调控区域的注释信息资源。该数据库由俄罗斯科学院西伯利亚部的细胞学与遗传学研究所提供技术支持与日常维护。

TFdb 数据库   

http://genome.gsc.riken.jp/TFdb/

TFdb是一个专业的关于小鼠转录因子的非冗余数据库。该数据库由RIKEN基因组科学中心进行日常维护。

TRED 数据库  

http://rulai.cshl.edu/cgi-bin/TRED/

TRED为转录调控元件数据库,是基于研究基因调控网络的需要而建立的数据库,收集有实验证据的哺乳动物顺式作用元件和反式作用因子。TRED为公开数据库,由冷泉港实验室承担数据整理及维护工作。

除了这些主要的数据库,还有PAZAR http://www.pazar.info,MAPPER http://bio.chip.org/mapper, DBTSS, DBD, AGRIS等其他转录因子及其结合位点相关数据库。

华丽丽的分割线

好了,数据库介绍了这么多,那么如何预测转录因子结合位点呢(Transcription factor binding site)?  这才是实用的呢。。。

首先介绍两款免费的在线软件

Jaspar 和 PROMO

http://jaspar.genereg.net/和PROMO, http://alggen.lsi.upc.es

我们还是以上一篇文中NF-kB 和 ANKH 为例,这里选择PROMO这款介绍一下…

首先,网站登陆进去是长这个样子的…

SelectSpecies 选择 Human; SelectFactors 选择 NF-kB; SelectSites 输入之前你所获得的那段ANKH的启动子序列(上文中我们最后保存下来的那段序列),等待三五分钟,结果中有一个位点 TGGGAAATACCT。

这里再小分享下~大家可以把找到的启动子序列和转录因子结合位点全部保存在SerialCloner这款软件中,目前最新版本是2.6.1这个,非常实用方便,而且有分别适用于Wins和Mac的免费版本哦!

OK~~说了这么多,小伙伴们有没有get到小技能呢~~


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
主要转录因子数据库
转录因子与靶基因预测操作-正义链
OmicShare Forum 专业的生物信息学论坛
最强攻略5:史上最全转录调控数据库汇总解读
手把手教你预测转录因子结合位点
一文教会你查找基因的启动子、UTR、TSS等区域以及预测转录因子结合位点
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服