打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
人类转录因子簇的功能、表达和发展进化

高等生物的转录调控是当今研究热点之一。转录调控系统在细胞生物过程中发挥着核心作用,包括细胞周期、细胞代谢、细胞分化和发育进程等1,2。转录因子(transcription factorsTFs)是调控基因表达的主要细胞成分,其活性决定了细胞功能及其对环境的反应。有关转录调研究主要分布在分子生物学和遗传学研究,其中很多研究工作通过免疫沉淀和计算机预测等实验方法来识别结合位点,然而,却极少关注转录调控本身。



在过去十多年里,利用全基因组测序以及高通量实验技术,人们可以更好的诠释转录调控系统的功能和结构。通过全基因组以及单个生物或者多基因群体中研究DNA结合结构域(DNA-binding domainDBD),转录因子库基本形成。然而,过去对转录因子库的研究,尤其是基因组方面的,几乎都含有误导性。另外,序列搜索方法的技术限制以及算法会出现假阳性结果,甚至在真阳性结果中,检测到的DBD存在于非转录因子蛋白中,因而也使得结果不可信。所以,我们缺乏一个完整表征人类转录因子库。


本文通过分析并展示1131个人工筛选的序列特异性DNA结合转录因子,并且通过手动检测编码潜在DNA结合功能的每个位点以减小预测错误,从而形成了完整的高质量的转录因子簇。然后评估这些转录因子的组织特异性表达、基因组分布以及进化保守性。具体分析和处理如下:


1.转录因子库功能确认:首先,Nicholas等从InterPro数据库整合了347DNA结合结构域和家族,然后从IPI数据库中提取了可以和347DBD或其家族成员结合的4610个蛋白。这些蛋白可以映射到1960个人类基因组位点。


1 转录因子调控的生物学过程


接下来手动检查每个位点,并按照可信程度其分成可信、可能及不可能转录因子三组。最终找到了1391个可信转录因子基因位点,216个可能转录因子基因位点。


通过PubMedGO数据库,Nicholas等评估了这些转录因子的调控功能,并发现其主要涵盖细胞周期调控、细胞发育、代谢调控等等生物学过程。(图 1



上述的三组转录因子中占据已有人类转录因子库的80%,其中有 675 个转录因子属于C2H2锌指结构,257个转录因子属于同源域结构,87个转录因子属于螺旋--螺旋结构。另外,这三类转录因子几乎覆盖小鼠转录因子库。

2.转录因子的表达: Nicholas等通过对原始数据进行再处理,并设置了表达阈值以确定生物样本中基因存在与否。然后排除了肿瘤样本和细胞系,进一步分析32个健康组织和器官。这样可以初步确定这些转录因子起作用的位点。Affymetrix GeneChips结果显示,检测的32个样本可映射到876个转录因子和10922个非转录因子基因中,其中转录因子的表达水平会比非转录因子表达水平低,但这种低表达水平可以保证转录因子结合到高亲和力位点。


 转录因子表达模式:在不同的组织类型中,转录因子表达的数量差异显著,如阑尾、皮肤、平滑肌中约有150个转录因子表达,而整个大脑、甲状腺和胎盘中约有300个转录因子表达。(图2)但是在所有基因中,转录因子相对表达比例稳定在6%左右。将计算倾向值作为组织特异性表达转录因子的衡量指标,上述转录因子表达可主要分为两种模式:一是泛表达模型(共有161个转录因子),即在所有或大多数组织中具有相似的表达水平,如生物钟调节因子CLOCK;二是选择性表达模型(共有349个转录因子),即只在某些组织中表达,具备组织和时空特异性,如睾丸锌指结构蛋白ZBTB32等。并且,在172个未知功能的转录因子中,有62个属于泛表达模型,有109个属于组织特异性表达模型,说明其在某些组织中可以调控生物过程。


2 32个组织器官中转录因子表达模式


转录因子间的相互协作包括蛋白间相互作用,无论是同源家族或异源家族转录因子间的相互作用3,亦或是无关转录因子间相互作用。转录因子进一步研究可针对泛表达和特异性表达转录因子的相互作用分析,这种组合分析有助于进一步阐明转录因子组合调控模式及其最终的调控功能。


3.TF库的进化:基因功能及其基因组结构与其进化是密切相关的。通过Ensembl Compara数据库,转录因子可分为五种不同的保守模型,这五种模型存在于所有的灵长类、大多数哺乳动物、脊椎动物或后生动物、真核生物中。新的调控基因增加与有机体复杂性增加成正相关,并且促使有机体产生新的功能。另外,Nicholas等发现,不同类型的DNA结合结构域的是非均衡扩增的,如同源域首先出现在后生动物中,到了脊椎动物阶段后高度扩增,但是螺旋--螺旋结构起始于后生动物,但是自此之后并不显著扩增。转录因子扩增特点或许为其改造或者创造表达模式的进化提供依据。


过去有报道等位基因串联簇,同样地,转录因子中Hox基因染色体的271217位点处也有生物学功能簇4。为了识别相似的基因簇,Nicholas等研究了异常高比例转录因子的基因域。(图3)结果显示:上述的转录因子中含有284个转录因子基因的23个高密度基因簇,包括Hox域和C2H2锌指结构基因域等5


根据TF编码基因进化史可以将这些基因簇分为两种类型:第一类由15个基因簇组成,包含一系列的旁系同源基因,表明其是通过串联重复形成的。第二类由8个基因簇组成,其主要位于着丝粒或端粒中。


3 人类基因组中转录因子簇位点


新调控功能的发展进化:鉴于转录因子的保守性,Nicholas等评估不同生物的直系同源基因是否具有相似的功能,调节蛋白是否形成物种间的表型差异。这也是近年来人们津津乐道的话题。在某些方面,这也有助于我们更好的理解人类转录因子基因的作用。古老基因(更保守基因)广泛表达,主要参与细胞的基本功能,而新基因(较保守基因)是选择性表达,参与特异性事件。最近的报道显示,调控发育进程的转录因子会比其他类型的调控子更古老6TF编码的基因会通过选择进化得以保留7。因此,TF编码基因及其靶位点会进化较快。


转录因子和人类疾病:大多数疾病的发生都因为转录调控功能的瓦解,如癌基因的转录因子(转录因子)过表达8,三分之一的人体发育障碍是由于转录因子失调等9Nicholas等运用OMIM数据库检测了转录因子基因的比例,并发现有164个转录因子与277种疾病或者综合征直接相关,其中很大一部分是与缺陷相关,所以也强调了发育早期中转录因子的重要性。转录因子本身的错误调控也会导致复杂的多基因疾病相关,如癌症或帕金森10


尽管上述过程处理和分析十分谨慎小心,但是方法过度依赖InterPro数据库和检测序列的算法能力,也使得不乏有不准确性的存在。因而转录因子库需要随着数据库和基因组的更新而更新。而手动检测是依据现有的文献的,所以这些基因需要随着报道更新。


本研究完成了人类基因组中序列特异性DNA结合转录因子的识别、功能分析以及表达、进化方面普查分析,弥补了已有的转录体本身研究的不足和现有的缺陷,为今后阐明不同哺乳动物生物过程中的转录调节机制和系统性特征研究奠定了基础。


参考文献:

1 Simon, I. et al. Serial regulation of transcriptional regulators in theyeast cell cycle. Cell 106, 697-708 (2001).


2 Dynlacht, B. D. Regulation oftranscription by proteins that control the cell cycle. Nature 389, 149-152,doi:Doi 10.1038/38225 (1997).


3 Amoutzias, G. D. et al. One billion years of bZIP transcription factor evolution:Conservation and change in dimerization and DNA-binding site specificity. Mol Biol Evol 24, 827-835, doi:10.1093/molbev/msl211 (2007).


4 Scott, M. P. Vertebrate Homeobox GeneNomenclature. Cell 71, 551-553, doi:Doi10.1016/0092-8674(92)90588-4 (1992).


5 Grimwood, J. et al. The DNA sequence and biology of human chromosome 19. Nature 428, 529-535, doi:10.1038/nature02399 (2004).


6 Lopez-Bigas, N., De, S. & Teichmann,S. A. Functional protein divergence in the evolution of Homo sapiens. Genome Biol 9, doi:Artn R33


10.1186/Gb-2008-9-2-R33 (2008).


7 Bustamante, C. D. et al. Natural selection on protein-coding genes in the humangenome. Nature 437, 1153-1157, doi:10.1038/nature04240 (2005).


8 Furney, S. J., Higgins, D. G.,Ouzounis, C. A. & Lopez-Bigas, N. Structural and functional properties ofgenes involved in human cancer. BMCgenomics 7, 3,doi:10.1186/1471-2164-7-3 (2006).


9 Boyadjiev, S. A. & Jabs, E. W.Online Mendelian Inheritance in Man (OMIM) as a knowledgebase for humandevelopmental disorders. Clin Genet 57, 253-266, doi:DOI10.1034/j.1399-0004.2000.570403.x (2000).


10 Scherzer, C. R. et al. GATA transcription factors directly regulate theParkinson's disease-linked gene alpha-synuclein. Proceedings of the National Academy of Sciences of the United States ofAmerica 105, 10907-10912,doi:10.1073/pnas.0802437105 (2008).



 


本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
打开APP,阅读全文并永久保存 查看更多类似文章
猜你喜欢
类似文章
【热】打开小程序,算一算2024你的财运
PBJ | 探究小麦祖先种、历史种和现代商业化品种中的启动子和5’UTR序列多样性
TiED:人类组织特异性增强子数据库
lncRNA,miRNA,TF的研究思路 – GCBI学院
包教包会,表观必备技能之Genecards查看基因信息
这题我会--如何弄清转录因子调控的基因(Cistrome DB数据库)
3DSNP | 非编码SNP 3维功能预测
更多类似文章 >>
生活服务
热点新闻
分享 收藏 导长图 关注 下载文章
绑定账号成功
后续可登录账号畅享VIP特权!
如果VIP功能使用有故障,
可点击这里联系客服!

联系客服