⑴ 几种常用Web数据库的比较
SWISSPROT的序列经过严格审核,注释完善,但数量仍较
少。
PIR数据量较大,但包含未经验证的序列,注释也不完善。
TrEMBL和GenPept的数据量最大,且随核酸序列数据库的
更新而更新,但是由于TrEMBL和GenPept均是由核酸序列
经过计算机程序翻译生成的,这两个数据库中的序列错误
率较大,并存在较多的冗余序列。
UniProt中的序列具有较好的代表性,数据较完整。
⑵ 什么是常用的三个数据库
目前,数据库管理系统关系型数据库为主导产品的商品化,技术相对成熟。虽然面向对象的数据库管理系统的先进技术,数据库易于开发,维护,但尚未成熟的产品。国际和国内领先的关系数据库管理系统,甲骨文,Sybase,Informix和INGRES。这些产品支持多种平台,如UNIX,VMS,Windows上,而不是同一级别的支持。和成熟的IBM的DB2关系数据库。但是,DB2是内嵌于IBM的AS/400系列机,只支持OS/400操作系统。
?1.MySQL
?MySQL是最受欢迎的开源SQL数据库管理系统,由MySQL AB公司,发布和支持。 MySQL AB是基于MySQL开发一个商业公司,它是利用与开源值相结合的一个成功的商业模式?和方法论的第二代开源公司。 MySQL是MySQL AB的注册商标。
?MySQL是一个快速,多线程,多用户和健壮的SQL数据库服务器。 MySQL服务器支持关键任务,重负载生产系统的使用,它可以嵌入到一个大配置(大规模部署)软件。
?的MySQL与其他数据库管理系统相比,具有以下优点:
?(1)MySQL是一个关系数据库管理系统。
?(2)MySQL是开源。
?(3)MySQL服务器是一个快速,可靠和易于使用的数据库服务器。
?(4)在MySQL服务器的客户机/服务器或嵌入式系统。
?(5)可以使用MySQL软件。
2.SQL Server的吗?
?SQL Server是由微软开发的数据库管理系统,是目前最流行的数据库,用于存储在网络上的数据,它已被广泛用于电子商务,银行,保险,电力和其他数据库相关的产业。
?SQL Server 2005的最新版本,它只能在Windows作业系统的稳定运行是非常重要的数据库。并行实施和共存模型并不成熟,这是很难对付越来越多的用户和数据量是有限的,可扩展性。
?SQL Server提供了网络和电子商务功能,如丰富的XML和Internet标准的支持,轻松且安全地通过Web访问的数据的范围很广,有一个强大,灵活和网络,基于安全和应用管理。此外,由于它的易用性和友好的用户界面,通过广大用户的好评,。
?3.Oracle
?提出的数据库,该公司首先想到的,通常是甲骨文(Oracle)。该公司成立于1977年,原是一个专门开发的数据库公司。甲骨文一直在数据库领域的领导者。 1984年,第一个关系数据库转移到一台台式电脑。然后,Oracle5率先推出的分布式数据库,客户机/服务器体系结构的新概念。甲骨文公司的第一行锁定模式和对称多处理计算机的支持......最新的Oracle对象技术,成为关系 - 对象数据库系统。目前,甲骨文的产品涵盖了几十个型号的大,中,小型机,Oracle数据库已成为世界上使用最广泛的关系数据。
Oracle数据库产品具有以下优良特性。
?(一)兼容性
?Oracle产品使用标准的SQL,和美国国家标准技术局(NIST)测试后。兼容IBM的SQL / DS,DB2中,安格尔的IDMS / R。
?(2)可移植性
??甲骨文的产品,可以广泛的硬件和操作系统平台上运行。可以安装在超过70种大不同,VMS系统的DOS,UNIX上,Windows和其他操作系统,小型机;
?(3)协会
甲骨文与各种通信网络连接,支持各种协议(TCP / IP协议说,DECnet,LU6.2工作等)。?
?(4)高生产率
?Oracle提供了多种开发工具,可以极大地方便进一步的发展。
?(5)开放
?Oracle的兼容性,可移植性,连接性和高生产力的Oracle RDBMS具有良好的开放性。
?4.Sybase
?马克B. Hiffman和罗伯特·爱泼斯坦,1984年,创建了Sybase公司,并于1987年推出了Sybase数据库产品。 SYBASE主要有三种版本:一是UNIX操作系统版本下运行的Novell Netware环境下运行的版本; Windows NT环境下运行的版本。 UNIX操作系统,目前应用最广泛使用的SCO UNIX SYBASE 10 SYABSE- 11。
??的Sybase数据库的特点:
?(1)它是基于客户机/服务器体系结构的数据库。
?(2)它是真正开放的数据库。
?(3)它是一种高性能的数据库。
?5.DB2
?DB2是内嵌在IBM的AS/400系统的数据库管理系统,直接从硬件支持。它支持标准的SQL语言,异构数据库连接的网关。因此,它具有速度快,可靠性好等优点。但是,只有硬件平台选择了IBM的AS/400,可以选择使用DB2数据库管理系统。
?DB2可以运行在所有主要平台(包括Windows),最适于海量数据。
?DB2是使用最广泛的企业级,而国内约5%,在1997年,在世界最大的500家企业,近85%的DB2数据库服务器。
?此外,微软的Access数据库,FoxPro数据库。现在有这么多的数据库系统,在游戏中进行编程,应该选择什么样的数据库?首要的原则,根据实际需要,另一方面,考虑游戏开发预算。现在常用的数据库:SQL Server中,我的SQL,甲骨文,FoxPro的。 MySQL是一个免费的数据库系统,其功能与一个标准的数据库功能,因此,建议使用独立制片人。甲骨文虽然功能强大,但它是用于商业用途,是目前在比赛中很少使用。
⑶ Swissprot数据库如何找出蛋白质的相似序列
总的而言有下列12种
0 = pairwise,显示具体匹配信息(缺省)
1 = query-anchored showing identities,查询-比上区域,显示一致性
2 = query-anchored no identities,查询-比上区域,不显示一致性
3 = flat query-anchored, show identities,查询-比上区域的屏文形式,显示一致性
4 = flat query-anchored, no identities,查询-比上区域的屏文形式,不显示一致性
5 = query-anchored no identities and blunt ends,查询-比上区域,不显示一致性,无突然的结束
6 = flat query-anchored, no identities and blunt ends,查询-比上区域的屏文形式,不显示一致性
7 = XML Blast output,XML格式的输出
8 = tabular,TAB格式的输出
9 =tabular with comment lines,带注释行的TAB格式的输出
10 =ASN, text,文本方式的ASN格式输出
11 =ASN, binary [Integer] default = 0,二进制方式的ASN格式输出
但是如果你在网站上进行,一般就为2-5种,如0 = pairwise, 8 = tabular,7 = XML Blast output,看你在哪个站点进行了
⑷ 如何利用swissprot预测磷酸化位点
基组注释析主要包括哪些内容
基组注释包括面内容:
(1) 重复序列预测通比已知重复序列数据库找序列包含重复序列识别类型并转化N或者X统计各种类型重复序列布
(2) 编码基预测通转录组或EST数据比拼接基组序列找编码基位置预测编码基结构或者通专业外显预测软件预测编码基外显结构
(3) RNA基预测通比已知RNA数据库或者通物信息(bioinformation)软件预测找些RNA基并进行类
(4) 调控序列假基预测
基功能注释使用数据库包括NT/NR, SwissProt/TrEMbl, InterPro, KEGG, COG, Gene ontology等使用比blast找同源相近基并注释功能
⑸ 蛋白质序列数据库包含哪些内容
蛋白质数据库
1. PIR和PSDPIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,包含超过142,000条蛋白质序列(至99年9月),其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。
PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
PIR和PSD的网址是:http://pir.georgetown.e/。
数据库下载地址是:ftp://nbrfa.georgetown.e/pir/。
2. SWISS-PROT
SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。
利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。
SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。
SWISS-PROT的网址是:http://www.ebi.ac.uk/swissprot/。
3. PROSITE
PROSITE数据库收集了生物学有显着意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下,某个蛋白质与已知功能蛋白质的整体序列相似性很低,但由于功能的需要保留了与功能密切相关的序列模式,这样就可能通过PROSITE的搜索找到隐含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;除了序列模式之外,PROSITE还包括由多序列比对构建的profile,能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。
PROSITE的网址是:http://www.expasy.ch/prosite/。
4. PDB
蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库,由美国Brookhaven国家实验室建立。PDB收集的数据来源于X光晶体衍射和核磁共振(NMR)的数据,经过整理和确认后存档而成。目前PDB数据库的维护由结构生物信息学研究合作组织(RCSB)负责。RCSB的主服务器和世界各地的镜像服务器提供数据库的检索和下载服务,以及关于PDB数据文件格式和其它文档的说明,PDB数据还可以从发行的光盘获得。使用Rasmol等软件可以在计算机上按PDB文件显示生物大分子的三维结构。
RCSB的PDB数据库网址是:http://www.rcsb.org/pdb/。
5. SCOP
蛋白质结构分类(SCOP)数据库详细描述了已知的蛋白质结构之间的关系。分类基于若干层次:家族,描述相近的进化关系;超家族,描述远源的进化关系;折叠子(fold),描述空间几何结构的关系;折叠类,所有折叠子被归于全α、全β、α/β、α+β和多结构域等几个大类。SCOP还提供一个非冗余的ASTRAIL序列库,这个库通常被用来评估各种序列比对算法。此外,SCOP还提供一个PDB-ISL中介序列库,通过与这个库中序列的两两比对,可以找到与未知结构序列远缘的已知结构序列。
SCOP的网址是:http://scop.mrc-lmb.cam.ac.uk/scop/。
6. COG
蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序,可以把某个蛋白质与所有COGs中的蛋白质进行比对,并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询,基于Web的COGNITOR服务,系统进化模式的查询服务等。
COG库的网址是:http://www.ncbi.nlm.nih.gov/COG。
下载COG库和COGNITOR程序在:ftp://ncbi.nlm.nih.gov/pub/COG。
⑹ 怎么在NCBI上查酵母中的TPS/TPP基因序列
一般而言,在NCBI(也就是Entrez数据系统)查基因序列,主要是搜索的NCBI的Genbank数据库的核酸与蛋白质序列,方法见六零六406。由于Genbank起初是一个类似BBS的序列数据库系统,虽然目前有人工核对序列,但其数据库中的序列质量还是不如Swissprot数据库。最近,我们在投递序列过程中,其管理员与我们进行了很多的交流(基本上都是PhD),所以他们肯定也开始注重数据质量了。但是,从数据规模上,NCBI还是比较全的,毕竟它有与EBI和DDBJ的数据每日交换机制。另外,NCBI提供的blast服务,也可以帮助你获得更多的同源序列。
因此,我建议首先从Swissprot上查询,下面以TPS为例:
1搜索swissprot中的TPS基因
http://www.uniprot.org/uniprot/?query=TPS&sort=score
我们得到两个酵母相关基因,利用你的专业知识判断选择一个或两个。
2点击进入P38426(TPS3_YEAST),查看蛋白质序列是否你想要的。
3进入NCBI的Blast服务页面,
http://blast.ncbi.nlm.nih.gov/Blast.cgi
在basicblast部分,你有两个选择:1)proteinblast->搜索蛋白质序列;2)tblastN->搜索核酸序列。
4进入程序搜索页面,将Swissprot的登录号P38426贴如输入框。
5再下面就是如何使用Blast。
6在Blast的结果中,你可以根据序列的相似性找你感兴趣的基因序列。
附图:一个blast的结果
⑺ 蛋白质序列数据库的数据库分类
PIR数据库按照数据的性质和注释层次分四个不同部分,分别为PIR1、PIR2、PIR3和PIR4。PIR1中的序列已经验证,注释最为详尽;PIR2中包含尚未确定的冗余序列;PIR3中的序列尚未加以检验,也未加注释; 而PIR4中则包括了其它各种渠道获得的序列,既未验证,也无注释。除了PIR外,另一个重要的蛋白质序列数据库则是SwissProt。该数据库由瑞士日内瓦大学于1986年创建,目前由瑞士生物信息学研究所(Swiss Institute of Bioinformatics,简称SIB)和欧洲生物信息学研究所 EBI共同维护和管理。瑞士生物信息研究所下属的蛋白质分析专家系统(Expert Protein Analysis System,,简称ExPASy)的Web服务器除了开发和维护SwissProt数据库外,也是国际上蛋白质组和蛋白质分子模型研究的中心,为用户提供大量蛋白质信息资源。北京大学生物信息中心设有ExPASy的镜象。PIR和SwissProt是创建最早、使用最为广泛的两个蛋白质数据库。随着各种模式生物基因组计划的进展,DNA序列特别是EST序列大量进入核酸序列数据库。蛋白质序列数据库TrEMBL是从EMBL中的cDNA序列翻译得到的。TrEMBL数据库创建是于1996年[Bairoch, 2000],意为“Translation of EMBL”。该数据库采用SwissProt数据库格式,包含EMBL数据库中所有编码序列的翻译。TrEMBL数据库分两部分,SP-TrEMBL和 REM-TrEMBL。SP-TrEMBL中的条目最终将归并到SwissProt数据库中。而Rem-TrEMBL则包括其它剩余序列,包括免疫球蛋白、T细胞受体、少于8个氨基酸残基的小肽、合成序列、专利序列等。与TrEMBL类似,GenPept是由GenBank翻译得到的蛋白质序列。由于TrEMBL和GenPept均是由核酸序列通过计算机程序翻译生成,这两个数据库中的序列错误率较大,均有较大的冗余度。另一个常用的蛋白质序列数据库是已知三维结构蛋白质的一级结构序列数据库NRL-3D[Namboodiri, 1990]。该数据库的序列是从三维结构数据库PDB中提取出来。
⑻ 为什么说swiss-prot是重要的蛋白质序列数据库
SWISS-PROT是含有详细注释内容的蛋白质序列数据库,由欧洲生物信息学中心(EBI)维护,目前已合并入 UniProt数据库,旨在帮助基因组和蛋白质组以及相关的分子生物学研究人员提供有关蛋白质氨基酸序列的最新信息。
SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立
了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。SWISS-PROT数据库包含了EMBL核酸序列数据库中被经过仔细检查和准确注释了
的蛋白质序列,一般地,任何蛋白质序列数据的搜寻和比较都应从SWISS-PROT开始。
SWISS-PROT蛋白质序列数据由大量序列条目组成,每一个序列条目
有其自己的格式。为了标准化的目的,SWISS-PROT的格式与EMBL核酸序列数据库的格式尽可能类似。SWISS-PROT涉及已知蛋白质的序列、
引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关
系、序列变异体和冲突等信息。利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。SWISS-PROT只接受直接测序
获得的蛋白质序列,序列提交可以在其Web页面上完成。
⑼ tair和swissprot数据库 哪个好
直接在主页右上角的搜索栏里输入要找的基因,找到后点击进入,往下翻翻页面就会看到一堆salk号,那些就是不同插入形式的突变体。