‘壹’ 常用的查询蛋白质结构以及序列的数据库主要有哪些
1. PIR和PSD
PIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库,可在这里下载。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。
PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
2. SWISS-PROT
SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。
利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。
3. PROSITE
PROSITE数据库收集了生物学有显着意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下,某个蛋白质与已知功能蛋白质的整体序列相似性很低,但由于功能的需要保留了与功能密切相关的序列模式,这样就可能通过PROSITE的搜索找到隐含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;除了序列模式之外,PROSITE还包括由多序列比对构建的profile,能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。
4. PDB
蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库,由美国Brookhaven国家实验室建立。PDB收集的数据来源于X光晶体衍射和核磁共振(NMR)的数据,经过整理和确认后存档而成。目前PDB数据库的维护由结构生物信息学研究合作组织(RCSB)负责。RCSB的主服务器和世界各地的镜像服务器提供数据库的检索和下载服务,以及关于PDB数据文件格式和其它文档的说明,PDB数据还可以从发行的光盘获得。使用Rasmol等软件可以在计算机上按PDB文件显示生物大分子的三维结构。
5. SCOP
蛋白质结构分类(SCOP)数据库详细描述了已知的蛋白质结构之间的关系。分类基于若干层次:家族,描述相近的进化关系;超家族,描述远源的进化关系;折叠子(fold),描述空间几何结构的关系;折叠类,所有折叠子被归于全α、全β、α/β、α+β和多结构域等几个大类。SCOP还提供一个非冗余的ASTRAIL序列库,这个库通常被用来评估各种序列比对算法。此外,SCOP还提供一个PDB-ISL中介序列库,通过与这个库中序列的两两比对,可以找到与未知结构序列远缘的已知结构序列。
6. COG
蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序,可以把某个蛋白质与所有COGs中的蛋白质进行比对,并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询,基于Web的COGNITOR服务,系统进化模式的查询服务等。
‘贰’ 蛋白质分子量在什么数据库查
NCBI上可以查分子量,还有其它的方也可以查。我推荐几个吧:
Genecards: www.genecards.org
gentlas:genatlas.medecine.univ-paris5.fr
Uniprot:http://www.uniprot.org
如果不够用,你联系我我帮你查吧。
‘叁’ 请利用网上数据库查找一种人源性蛋白的一级结构序列,并与小鼠的该同源蛋白序列进行比较。
人胰岛素的一级结构序列如下;
鼠胰岛素的一级结构序列如下;
比较如下;
放大以及加下划线的是人与小鼠相同的一级结构序列。不同的一级结构序列是字体比较小的那部分。
从两者的比较中,我们可以知道,人与小鼠的胰岛素一级结构序列基本相同,只有一些个别部分不同。
说明了:一级结构不同,生物学功能各异
一级结构中关键部位相同,其功能相同;关键部位改变,生物活性也改变
‘肆’ 如何利用网上数据库查找一种人源性蛋白的一级结构序列,并与小鼠的该同源蛋白序列进行比较
你可以去网上找PDB数据库.或者是SWISS-PROT库、PIR库,PDB库是一个蛋白质一级结构数据库....或者去GenBank数据库看看,不过这个好像是以核酸为主的.
‘伍’ 如何查找蛋白的分子量大小
大分子物质由于直径较大,不易进入凝胶颗粒的微孔,而只能分布颗粒之间,所以在洗脱时向下移动的速度较快。
小分子物质除了可在凝胶颗粒间隙中扩散外,还可以进入凝胶颗粒的微孔中,即进入凝胶相内,在向下移动的过程中,从一个凝胶内扩散到颗粒间隙后再进入另一凝胶颗粒,如此不断地进入和扩散,小分子物质的下移速度落后于大分子物质,从而使样品中分子大的先流出色谱柱,中等分子的后流出,分子最小的最后流出。
‘陆’ 如何查找蛋白质的分子量大小
www.uniprot.org
UniProt是一个集中收录蛋白质资源并能与其它资源相互联系的数据库,也是目前为止收录蛋白质序列目录最广泛、功能注释最全面的一个数据库。 UniProt是由欧洲生物信息学研究所(European Bioinformatics Institute)、美国蛋白质信息资源(Prontein Information Resource)以及瑞士生物信息研究所(Swiss Institute of Bioinformatics)等机构共同组成的UniProt协会(UniProt Consortium)编辑、制作的一个信息资源,旨在为从事现代生物研究的科研人员提供一个有关蛋白质序列及其相关功能方面的广泛的、高质量的并可免费使用的共享数据库。
UniProt是一个向所有使用者免费开放的数据库,全球科研人员都可以登陆网站www.uniprot.org浏览并下载这些资料。借助它,科研人员可以对目的蛋白进行交互式分析或特定的分析。
‘柒’ 怎样查找免疫球蛋白的胚系基因序列
貌似只能找到 小鼠(家鼠) 的免疫球蛋白胚系基因序列,重、轻链在不同的染色体上,如下:
重链:http://www.ncbi.nlm.nih.gov/gene/111507
轻链:http://www.ncbi.nlm.nih.gov/gene/56304
方法:在NCBI数据库gene选项里检索关键词:immunoglobulin heavy chain 与 immunoglobulin light chain ,然后都是选择第一个链接,希望对你有帮助!~
‘捌’ 请推荐几个常用的查生物英文文献的数据库,如springer
Spinger是个不错的数据库,再推荐你几个:
1. NCBI(美国国立生物技术信息中心) 数据库
www.ncbi.nlm.nih.gov
可以查阅的内容丰富,不仅可以查阅文献,还可以检索蛋白质,基因序列,一些已完成测序的生物的全基因组序列等.比如E.coli等.
2. ISIKnowledge
www.isiknowlege.com
专业的英文文献检索系统.
3. 美国化学学会
http://pubs.acs.org
我也是学生物的,呵呵,这些都是精华,与你分享,主要还是要看你所在的单位有没有这些数据库的访问权.
‘玖’ 国际着名的三大蛋白质数据库
国际着名的三大蛋白质数据库有UniProt数据库、The Human Protein Atlas数据库、PhosphoSitePlus数据库。
1、UniProt数据库
蛋白组学常用数据库UniProt(全称UniProt Protein Resource),建立于1986年,由Swiss-Protein、TrEMBL、PIR-PSD三大蛋白质数据库联合成立的,其信息量丰富、资源广泛,是目前公认的首选免费蛋白质数据库。
2、The Human Protein Atlas数据库
The Human Protein Atlas内含近30000种人类蛋白质的组织和细胞分布信息,并提供免费查询。
瑞典Knut&Alice Wallenberg基金会利用免疫组化技术,检查每一种蛋白质在人类48种正常组织,20种肿瘤组织,47个细胞系和12种血液细胞内的分布和表达,其结果用至少576张免疫组化染色图表示,并经专业人员校对和标引,保证染色结果具有充分的代表性。
3、PhosphoSitePlus数据库
PhosphoSitePlus数据库是一个由CST和NIH联合开发的免费资源数据库,总结归纳了海量通过科学研究发现的蛋白修饰位点,包括磷酸化、甲基化、乙酰化、泛素化等,并且包括一些CST公司发现但未发表的蛋白修饰位点。
该数据库是动态的、开放的、高度互动并持续更新的。它有助于研究PTMs在正常和病理细胞/组织中的作用,同时它也是发现新的疾病标志物和药物靶点的有力工具。
性能及历史
蛋白质数据库(HPDB),建于2005年5月,动态展示生物大分子立体结构,鼠标点击放大分子结构、原子定位、测定原子之间距离,可用于教学或科研。服务对象是能够熟练使用中文的生命科学、医学、药学、农学、林学等领域的大中专学生、教师及科技工作者。
分子结构特征描述采用汉语,同时提供英文原文以供考证。对于善于使用英文的读者,我们提倡直接访问RCSB PDB,一来可以减少网络拥挤,二来可以减少由于HPDB的翻译不妥带来的不便。
蛋白质数据库(HPDB)对每个蛋白质分子结构说明部分做了中文翻译(最新加入数据库的分子除外),内容包括分子结构定性描述、样品的来源、表达载体、宿主、化学分析方法、分子结构组成成分等。这些信息并同蛋白质分子结构数据存储于数据库,因此HPDB支持中文查询。
蛋白质数据库(HPDB)虽然翻译了“分子结构说明”部分,但为了保证数据的可靠性和准确性,HPDB对一级结构序列及大分子结构坐标数据等未做任何改动,数据库保持RCSB PDB核实后的原始实验数据文件,并保持PDB文件格式和蛋白质分子编号。
‘拾’ 如何利用网上数据库查找一种人源性蛋白的一级结构序列,并与小鼠的该同源蛋白序列进行比较
到NCBI官网,数据库选择protein,输入蛋白质名称,然后再结果里找物种为human的结果,拿到这个序列到NCBI的Blast里比对,程序选择Blastp,比对结果中肯定至少有一个是小鼠同源蛋白。或者直接用clustalX把human,mice的蛋白序列直接比较。