打开APP
userphoto
未登录

开通VIP,畅享免费电子书等14项超值服

开通VIP
蛋白质数据库UniProt介绍

蛋白质数据库UniProt介绍

2017-03-19 唐僧唐 免疫细胞研究bioworld
免疫细胞研究bioworld

antibody-king

服务于生物,医学,药学三大行业,精准对接!


今天给大家介绍一下蛋白质数据库UniProt的简要使用方法。


        UniProt(全称Universal Protein),它整合了三个老字号数据库(Swiss-Prot、 TrEMBL 和 PIR-PSD )的数据。是目前信息最丰富、资源最广的免费蛋白质数据库(注意没有之一哦!)。

今天我带大家来简单游览一下这个庞大的“蛋白质数据公园”。由于景点太多不可能一次看完,所以我们逐步深入吧!


        公园入口网址为http://www.uniprot.org/,先来看看全景图吧!这个公园可以大致分为5个主题部分,如上图红框所示1、UniProtKB;2、UniRef;3、UNIParc;4、Proteomics;5、Supporting data。


        这次我们先游览第一个主题,也是最经典的部分。(其实其他的主题我自己还没有完全搞明白)

1、UniProtKB(Universal Protein Knowledge base)它是经过专家校验的数据集,又分成两部分(绿框部分,不用担心,这些都是免费的,不是那种滥收费园中园

        1.1、Swiss-Prot (经过人工检查、校验的条目) 

高质量的、人工注释的、非冗余的数据集;主要来自文献中的研究成果和E-value校验过的计算分析结果。

        截止到昨天2017年03月19日Swiss-Prot 包含553,941条记录,(  2010年8月10日有519,348 条记录,7年后增加了3万多条记录,评价每天大约10几条记录,速度还是比较慢的。


        1.2、TrEMBL (计算机自动注释的、未经人工校验的条目)

该数据主要是利用计算机对大量基因组数据流进行分析注释(人工校验速度暂时无法跟上数据的产生速度)。

        截止到昨天2017年03月19日TrEMBL 包含80,204,459条记录,(  2010年8月10日有11,636,205 条记录,7年后数据量减少了很多,估计是去掉了很多重复的数据)另外大家会注意到这里的数据是Swiss-Pro数据的100多倍。


        游玩方式多种多样,1、主页默认的入口就是UniProt;2、可以直接点击红框1区域进入;3、也可以通过点击红框A,系统会弹出下拉菜单如图2所示,选择UniProt红框1即可进入。


        没来过的游客可以直接点击图1中的红框1,先随意到处走走看看,首先映入眼帘的是下面这幅图


        检索区主要是为了让有经验游客快速找到自己感兴趣的蛋白质,可以按照蛋白质的名称、序列,ID号等方式检索。下次再详细给大家讲解。


        红框1区是对这个主题区域的简要介绍,红框1区和检索区中间还有个工具栏,这个工具栏非常实用,先卖个关子,以后给大家介绍。


        红框2区可以让游客根据自己的喜好来显示蛋白质数据,比如可以只显示经过人工校验的条目;可以只看专属于某个物种的蛋白质;还可以检索物种分类;还有直接快速进入UniRef的通道以及视频化的帮助,演示文件。


        红框3区是主题区,这里列出了所有UniProt数据库的蛋白质条目,因为数据太多(80,758,400条,你发现了吧,这个数字其实是Swiss-Pro与TrEMBL两部分的总和),每页显示25条(您可以自己选择每页的显示数目 10、25、50、100或200),

详细说说这里到底有些什么东东:


红框3区第一行

 

t BLAST: 这个按钮可以让你用感兴趣的蛋白质序列做BLAST分析(就是查一下在UniProt数据库中,还有哪些蛋白质的氨基酸序列与你感兴趣的蛋白质相同或相似),别小瞧这个功能,知道哪些蛋白与目的蛋白序列相似,就有可能知道这个蛋白具有哪些生物系功能,如果恰好还有其他相似蛋白的结构信息,就能帮助你大致知道这个蛋白的空间结构。使用这个功能必须先选中,只能选中一个蛋白质


i Align: t BLAST是对单个蛋白序列与数据库数据进行比对,i Align可以让你对多个蛋白质的序列之间进行相似性比对,这种分析可以让你找到这些蛋白之间的结构保守区域,还可以根据蛋白质的相似性,分析这些蛋白之间的亲缘关系,进化的先后顺序等。


= Download:这个容易理解,您可以下载蛋白的序列数据,可以下载选中的蛋白,也可以下载全部蛋白(做蛋白质组学分析的人经常用,否则没有必要全部下载,不过有时候最好定期下载更新一下,还是很有必要的,昨天听朋友讲某个酵母的数据库因为被专利了,结果这个酵母的数据被删除了,再想下载就得付费了!

下载的格式也多种多样,比如FASTA,Text,Excel,XML,List等,如果数据量大,还可以选择压缩以后下载。


b Add to basket: 这个按钮的功能是可以随时将你感兴趣的蛋白质条目加入购物篮以备后期使用,最多可以加400条数据,呵呵,这个不是超市的购物篮,是不收费的。


e Columns: 这个可以让您定制蛋白数据列信息,就是自己定制显示哪些列信息,这个内容非常多,包括名称和分类学信息,序列信息(氨基酸长度,分子量,SNP等),功能信息(EC number, 信号通路,活性位点,各种结合位点等),相互作用信息,表达信息,亚细胞定位信息, 翻译后修饰,结构,家族及结构域信息, 序列信息.........太多了,感兴趣的自己进去看吧!


d: 这个是你本次检索结果的URL信息,有了这个URL您下次可以直接输入这个URL就会快速回到你之前检索的状态。


红框3区第二行, 相当于Excel的标题区


第一列供您选择数据,可以单选,多选或全选;

Entry:是UniProt的给每个蛋白质赋予的独一无二的ID号

Entry name: 是蛋白ID简要名字

Protein names: 蛋白质的名字

Gene names: 编码这个蛋白的Gene名字

Organism:蛋白质的种属来源

Length: 氨基酸长度

e: 就是第一行的e Columns


红框3区其他行


这里显示的是您检索后,或默认的蛋白质条目数据。


今天说的这里,下次我们一个具体实例看看到底这里有哪些让人着迷的数据信息。





导师们好, 目前在平台上登记的考研考生调剂的数据已经有571条!




获取考生调剂信息登记表格】数据的步骤:


阅读
精选留言

该文章作者已设置需关注才可以留言

写留言

    该文章作者已设置需关注才可以留言

    写留言

    加载中
    以上留言由公众号筛选后显示

    了解留言功能详情

    本站仅提供存储服务,所有内容均由用户发布,如发现有害或侵权内容,请点击举报
    打开APP,阅读全文并永久保存 查看更多类似文章
    猜你喜欢
    类似文章
    【热】打开小程序,算一算2024你的财运
    UniProt 数据库(新手指南)
    蛋白质组学相关数据库与使用方法
    【教你玩转科研工具】-擅用 UniProt 数据库
    听课笔记之蛋白质组学数据分析基础(三)
    SMART:蛋白质结构域数据库
    APT干货分享||UniProt数据库怎么看?
    更多类似文章 >>
    生活服务
    热点新闻
    分享 收藏 导长图 关注 下载文章
    绑定账号成功
    后续可登录账号畅享VIP特权!
    如果VIP功能使用有故障,
    可点击这里联系客服!

    联系客服