前言:生物医药领域(基础研究、临床研究,新药研发),蛋白分析是我们永远绕不开的一个重要环节。这篇文章我们介绍目前全世界最强大的蛋白质数据库——UniProt。并手把手教你如何使用好这个数据库,助你快速提取你所需要的关于某个蛋白的关键信息。
下面,让我们以mTOR 为例,分享操作方法。
进入网站
在浏览器中打开 https://www.uniprot.org/ 页面
UniProt数据库首页
网站简介
Uniprot数据库是Universal Protein的英文缩写,是信息最丰富、资源最广的蛋白质数据库。我们常用的是UniProtKB。UniProt knowledgetbase (UniProtKB)是收集蛋白质功能信息的中心枢纽,拥有准确、一致和丰富的注释。除了为每个 UniProtKB 条目捕获必需的核心数据(主要是氨基酸序列、蛋白质名称或描述、分类数据和引文信息)外,还添加了尽可能多的注释信息。
UniprotKB由两部分组成:Swiss-Prot和TrEMBL。
UniProtKB/Swiss-Prot:
高质量的、手工注释的、非冗余的数据集,这些数据都是由质量保证的。
UniProtKB/TrEMBL:
该数据集包含高质量的计算分析结果,需要我们手工注释。
检索蛋白
输入关键词 mTOR,点击右上方的 Search 按钮(单击键盘的Enter也可以);从种属分类处找到需研究的物种,就会出现该物种中mTOR蛋白的详细信息。
Entry:是Uniprot给每个蛋白质赋予的独一无二的ID(由此进入查看具体信息)
Entry name:是蛋白ID的简要名字
Protein names:蛋白质的名字
Gene names:编码这个蛋白的Gene名字
Organism:蛋白质的种属来源
Length:氨基酸长度
蛋白功能
详细信息界面,首先介绍的是「Function」,该板块会罗列出蛋白的基本功能及参与的生物学过程,这应该也是科研人员最关心的问题,具体的序列和结构只是为了方便研究或者更加深入理解蛋白的功能。每句介绍后的链接即是相应的参考文献( Publications),可以根据需要点击查阅。“By similarity”链接到最相似的蛋白,往往是不同种属中的相同蛋白,也就是同源蛋白(直系同源基因是同源基因,进化后分化形成不同的物种,这种现象被称为物种形成。这些基因通常与它们进化而来的祖先基因保持着相似的功能)。很多蛋白在进化过程中是高度保守的,也就是说他们的蛋白序列非常相似或者相同,这一类蛋白往往有非常强大的功能,参与多种生命活动或生物学功能。
命名和来源种属信息
随后的「Names & Taxonomy」板块展示的是该蛋白的命名(基因名称、同义词)和来源种属信息以及NCBI 和 Enzembl 的基因数据库链接。如有需要,可以直接点击或去 NCBI 和 Enzembl 数据库查阅。
亚定位
「Subcellular location」包含蛋白的细胞亚定位信息,从图中我们可以看出mTOR主要分布在溶酶体、高尔基体、线粒体、内质网、细胞核。
翻译后修饰
在「PTM/Processing」部分,UniProt 数据库会列举蛋白合成过程中的分子加工、氨基酸修饰及翻译后修饰,比如剪切、糖基化、脂酰化、二硫键位置等等。修饰过后的蛋白质分子质量就会增加。这也是为什么有些抗体的实际检测分子量和预测分子量有差别的原因之一,蛋白的翻译后修饰对于 WB 结果的判定,具有重要的辅助作用。有了这些,再也不用担心做 WB 找不到目的条带啦。
------------------------------------------------------------------------
嫌太长不爱看的看这:
浏览器中打开 https://www.uniprot.org/ ,输入自己感兴趣的蛋白质进行搜索,然后看屏幕左下方的导航窗口(如下图),根据自己的需求选择查看相应的信息,应有尽有。初次查看建议从上到下全看完。
-------------------------------------------------------------------------
联系客服