① ncbi是什么数据库
NCBI是美国国家生物技术信息中心,建立于1988年。NCBI的初衷是为了给分子生物学家提供一个信息储存和处理的系统,除了建有GenBank核酸序列数据库之外,NCBI还可以提供众多功能强大的数据检索与分析工具。
NCBI是National Center for Biotechnology Information的缩写,指美国国家生物技术信息中心,建立于1988年。NCBI的初衷是为了给分子生物学家提供一个信息储存和处理的系统,除了建有GenBank核酸序列数据库(该数据库的数据资源来自全球几大DNA数据库,其中包括日本DNA数据库DDBJ、欧洲分子生物学实验室数据库EMBL以及其它几个知名科研机构)之外,NCBI还可以提供众多功能强大的数据检索与分析工具。
② 国际上三个大的生物信息中心有哪些
一 美国国家生物技术信息中心NCBI(National Center for
Biotechnology Information)
NCBI是一个极具人性化的网站,网站的主页清晰的阐明了NCBI所做的工作及相关领域最新的热点内容,新闻等。为了方便使用者更加熟练使用网站资源,NCBI在主页清晰的标注了站点导航,非常便于初学者熟悉和掌握NCBI的站内资源。
另外,NCBI将其网站资源列于主页左侧,其中包括:SITE MAP, About NCBI, GenBank, Literature
databases, Molecular databases, Genomic biology, Tools, Research at
NCBI, Software engineering, Ecation, FTP site, Contact
information等等。
二EBI(European
Bioinformatics Institute)欧洲生物信息研究所The European
Bioinformatics Institute(EBI)是目前国际上几个重要分子生物信息网站之一,位置座落于英国The Wellcome Trust
Genome Campus。EBI的任务就是确保分子生物与基因体的研究信息可以公开并且免费提供给科学社群,以促进科学进步。
EBI所提供的服务包括建立/维护数据库、提供分子生物相关信息服务、执行分子生物与计算分子生物研究;所服务的对象与研究人员扩及各产业,包括分子生物、基因体、医学与农业学术研究、农业、生物技术、化学与制药工业。
三DDBJ(DNAData Bank of
Japan)日本核酸数据库
DDBJ(DNA Data Bank of Japan)
设立在日本国家遗传研究所(NIG),于1986年开始DNA数据库的构建工作。从一开始,DDBJ就作为国际性DNA数据库之一,发挥着重要的作用。它
首先反映的是日本国内数据库的资源,并与NCBI,EBI进行频繁的国际性合作。DNA序列中蕴含了大量的数据资源,比起其它生物学数据,它在阐述进化方面的作用更为直接。因此,探求DNA数据库,不仅是在生命科学方面的研究,更是为人类的发展谋福利。
DDBJ是日本唯一的DNA数据库,它从研究者那里收集DNA 序列并且给数据提交者一个国际公认的编码。DDBJ
主要从日本研究者那里收集数据,当然,它也接受外国研究者的数据并给以编码。
③ DNA数据库的介绍
集合所有已知核酸的核苷酸序列,单核苷酸多态性、结构、性质以及相关描述,包括它们的科学命名、来源物种分类名称、参考文献等信息的资料库。基因和基因组的资料也包含在DNA数据库中。目前国际上比较重要的核酸(含蛋白质)一级数据库有美国的GenBank、欧洲的EMBL和日本的DDBJ。三个数据库信息共享,每日交换,故资料是一样的,唯格式有所不同。
④ 什么是生物信息学中的二级数据库
一、生物信息学数据库的种类
分子生物信息数据库种类繁多。归纳起来,大体可以分为4个大类:
基因组数据库
核酸和蛋白质一级结构数据库
生物大分子(主要是蛋白质)三维空间结构数据库
由上述3类数据库和文献资料为基础构建的二级数据库
一级数据库(一次数据库) :基因组数据库来自基因组作图,序列数据库来自序列测定,结构数据库来自X射线衍射和核磁共振等结构测定。这些数据库是分子生物学的基本数据资源,通常称为基本数据库、初始数据库,也称一次数据库。
二级数据库(二次数据库) :是在一级数据库、实验数据、理论分析的基础上,衍生整理而得。它是根据生命科学不同研究领域的实际需要,对基因组图谱、核酸和蛋白质序列、蛋白质结构以及文献等数据进行分析、整理、归纳、注释,构建具有特殊生物学意义和专门用途的数据库。
一般说来,一级数据库的数据量大,更新速度快,用户面广,通常需要高性能的计算机服务器、大容量的磁盘空间和专门的数据库管理系统支撑。
二级数据库的容量则小得多,更新速度也不像一次数据库那样快,也可以不用大型商业数据库软件支持,这类针对不同问题开发的二次数据库的最大特点是使用方便,特别适用于计算机使用经验不太丰富的生物学家。
序列数据库是分子生物信息数据库中最基本的数据库,包括核酸和蛋白质两类,以核苷酸碱基顺序或氨基酸残基顺序为基本内容,并附有注释信息。
GenBank:由美国国家生物技术信息中心(National Center for Biotechnology Information, NCBI)建立(1979-1982)。该中心隶属于美国国家医学图书馆,位于美国家卫生研究院(NIH)内。
EMBL:由欧洲分子生物学实验室(European Molecular Biology Laboratory, 其下有European Bioinformatics Centre)建立(1982),主要位于英国剑桥Cambridge和德国汉堡Hamburg。
DDBJ:日本DNA数据库(DNA Data Bank of Japan)。由the National Institute of Genetics建立(1984-1987), NIG主管。
二级数据库的形式:大多以web界面为基础,具有文字信息、表格、图形、图表等方式显示数据库内容。
一级数据库与二级数据库之间并无明确的界限。(例如:GDB、AceDB、SCOP、CATH等都已经具有二级数据库的特色)。
⑤ ncbi,embl和什么并称三大数据库
DDBJ:DNA Data Base of Japan 是日本人建立的核酸数据库;
NCBI中的Genbank是美国建立的核酸数据库;
EMBL是欧洲建里的核酸数据库;
这三个数据库是连通的,数据共享。
⑥ 什么是Genbank,它的主要用途是什么
GenBank 概述
· 什么是GenBank? GenBank 是一个有来自于70,000多种生物的核苷酸序列的数据库。每条纪录都有编码区(CDS)特征的注释,还包括氨基酸的翻译。GenBank属于一个序列数据库的国际合作组织,包括EMBL和DDBJ。
· 纪录样本 - 关于GenBank的各个字段的详细描述,以及同Entrez搜索字段的交叉索引。
· 访问GenBank - 通过 Entrez Nucleotides 来查询。用 accession number,作者姓名,物种,基因/蛋白名字,还有许多其他的文本术语来查询。关于 Entrez 更多的信息请看下文。用 BLAST 来在 GenBank 和其他数据库中进行序列相似搜索。用E-mail来访问Entrez 和 BLAST 可以通过 Query 和 BLAST 服务器。另外一种选择是可以用 FTP 下载整个的 GenBank 和更新数据。
· 增长统计 - 参见公布通知的2.2.6(每个分类的统计),2.2.7(每个物种的统计),2.2.8(GenBank增长)小节。
· 公布通知,最新 - 最近和即将有的变化,GenBank 的分类,数据增长统计,GenBank 的引用。
· 公布通知,旧 - 同上相同,是过去公布的统计。
· 遗传密码 - 15个遗传密码的概要。用来确保GenBank中纪录的编码序列被正确的翻译。
向GenBank提交数据
· 关于提交序列数据,收到 accession number,和对纪录作更新的一般信息。
· BankIt - 用于一条或者少数条提交的基于WWW的提交工具软件。(请在提交前用 VecScreen 去除载体)
· Sequin - 提交软件程序,用于一条或者很多条的提交,长序列,完整基因组,alignments,人群/种系/突变研究的提交。可以懒⑹褂茫�蛘哂没�赥CP/IP的"network aware"模式,可以链接到其他NCBI的资源和软件比如Entrez和PowerBLAST。(请在提交前用VecScreen去除载体)
· ESTs - 表达序列标签,短的、单次(测序)阅读的cDNA序列。也包括来自于差异显示和 RACE 实验的 cDNA 序列。
· GSSs - 基因组调查序列,短的、单次(测序)阅读的cDNA序列,exon trap 获得的序列,cosmid/BAC/YAC 末端,及其他。
· HTGs - 来自于大规模测序中心的高通量基因组序列,未完成的(阶段0,1,2)和完成的(阶段3)序列。(注意:完成的人类的HTG序列可以同时在 GenBank 和 Human Genome Sequencing 页面上访问。)
· STSs - 序列标签位点。短的在基因组上可以被唯一操作的序列,用于产生作图位点。
· 注:SNPs - 人类的和其他物种的遗传变异数据可以提交到NCBI数据库的单核苷酸多态性库中(dbSNP)。
国际核苷酸序列数据库合作组织
· GenBank,DDBJ,EMBL - 合作计划的概述,并链接到相应的主页。GenBank,DDBJ(DNA Data Bank of Japan),and EMBL (European Molecular Biology Laboratory)数据库共享的数据是每天都交换的,因此他们是相等的。数据纪录的格式和搜索方式可能会不一样,但是accession number,序列数据和注解都是一模一样的。即,你可以用accession number U12345在GenBank,DDBJ或EMBL中查找相应纪录,得到的结果是完全一样的序列数据,参考内容等等。
· DDBJ/EMBJ/GenBank 特性表 - 特性表格式和标准被合作数据库用在序列记录的注释上,使得数据共享成为可能,包括详细的描述生物特性和特性限定语的附录,以及IUPAC规定的核苷酸和氨基酸的代号。
FTP GenBank 及每日更新
· GenBank普通文件格式 - 参见GenBank记录样本和在GenBank公布通知中的详细描述,下载大多数最近的完全公告和日常积累或非积累更新数据。
· ASN.1格式 - 摘要句法记号1,国际标准组织(ISO)数据表示格式,下载大多数最近的完全公告和日常积累或非积累更新数据。
· FASTA格式 - 定义行号后只跟随序列数据(示例),参见描述数据库的readme文件,包括nt.Z(每天更新的非冗余BLAST核酸数据库,包括GenBank+EMBL+DDBJ+PDB序列,但是不包括EST, STS, GSS, or HTGS序列),nr.Z(每日更新的非冗余蛋白质),est.Z, gss.Z, htg.Z, sts.Z,和其它文件。
http://www.bioon.com/biology/Print.asp?ArticleID=1256
⑦ 世界上主要的基因库有哪几个
uropean Molecular Biology Laboratory (EMBL) ,欧洲分子生物学实验室.
Cambridge,UK.
· GenBank ,美国国家生物技术信息中心 (NCBI)所维护的供公众自由读取的、带注释的DNA序列的总数据库.
· DNA Databank of Japan (DDBJ) ,日本核酸数据库.
主要就这三个,当然还有一些其他的专门的基因数据库.
⑧ 数据库在植物检疫中的作用是什么
数据库在植物检疫中的作用越来越重要。各种类型的检疫数据库相继建立,并应用于植物检疫。EPPO建立了植物检疫PQ数据库。该数据库包括了EPPO所有A1和A2名单中的有害生物的寄主范围、地理分布及其他详尽的目录。同时,包括每种有害生物在一个国家中发生程度的细节如温室、田间发生情况,传入日期及扑灭情况的信息。EPPO还和CABI合作,为欧盟(EU)编制了植物检疫资料单的数据库,其目的是使欧盟的植物检疫建立在统一的检疫条款基础之上。资料单使用标准化的标题,分别是有害生物(包括学名、异名、分类地位、俗名、命名和分类的说明)、寄主、地理分布、生物学、检测和鉴定、传播和扩散的方式、有害生物的重要性(包括经济影响、防治和检疫风险)和植物检疫措施及参考文献。目前不仅有电子版的数据库,还出版了《欧洲检疫性有害生物》的参考书。
FAO开发的全球检疫信息系统亦是一个相类似的检疫数据库。该数据库不仅提供同上述相似的数据,而且还能提供有关国家和地区植保组织的植物检疫条例摘要、检疫性有害生物名单及处理方法。另外,FAO/国际作物遗传资源局IBPGR的种质资源安全运输的技术指南、美国农业部反映检疫截获信息的植物检疫截获记录数据库、亚洲太平洋地区的植物检疫中心和培训研究所(PLANTI)的植物信息数据库(PLANT1NFO)等都是有关植物检疫的专业数据库。另外,USDA-APHIS和USDA-ARS建立的国家农业病原信息系统(NAPIS)和世界植物病原数据库(WPPD)及由澳大利亚AQIS建立的病虫害信息库亦是检疫中很重要的数据库。CABI在1998年推出了全球植物保护手册(CPC)的光盘,可供各植检单位使用。该光盘提供了大量的有害生物的生物学资料、信息和照片。
在中国,检验检疫部门亦已经开发了一个《动植物检验检疫文献题录数据库》。该库收录了农业部1996年公布的97种进境动物的一二类传染病、寄生虫病和84种(类)进境植物检疫为险性有害生物的文献,包括自1971年至今的近11万条有关动物疫情和植物有害生物的信息,并可查询有关的寄主信息,是动植物检验检疫部门开展科研工作进行文献检索的有力工具。
除以上数据库外,还有其他类型的事实型数据库,包括拜耳公司(BayerAG)的有害生物名称和异名数据库,有关防治方法特别是遗传抗性和杀虫剂信息的数据库(Russell,1991年;Kidd,1991年)及关于标本和培养物的数据库(Allsop等,1989年)等均大大便利了PRA工作的开展。特别值得一提的是,因为生物命名法的不断变化,其连续性还不完善,而且生物数量巨大,因此生物名称库在提供获取其他信息的途径时,具有特别重要的意义。CABI国际农业生物中心索引库CABIThesaurus就建立了与农业及相关学科有关的75000个词库,其中1/10的术语是昆虫名称。在其节肢动物名称索引(ANI)中,约有10万个昆虫和其他节肢动物的名称和异名,且这些异名在植物保护的文献中经常遇到。其他还有澳大利亚国际农业研究中心编制的东南亚农业主要节肢动物及杂草名录,FAO(1993年)编制的亚太地区主要作物重要有害生物名录等,均是有价值的信息源。现代信息技术亦为了解各国的检疫法规提供了便利,如欧盟建立的JUSTIS-CELEX数据库系统。该系统包括欧共体1952年成立以来颁布的全部法规,如贸易、金融、海关和动植物检验检疫法规等。在中国,亦已建立了《中外法律信息系统》,这些法规数据库将为检疫执法和决策提供有力的证据。
随着分子遗传学越来越广泛地应用于植物保护,特别是有害生物的分类和鉴定中,其迅速扩大的核酸蛋白序列数据库可为PRA工作提供有害生物在分子水平上的信息。目前已建立的核酸蛋白序列数据库有欧洲分子生物学实验室核酸序列数据库EMBI(1988年)、基因银行Genbank(1992年)、美国的核糖体数据库RAP(RibosomalDatabaseProject,1993年)、日本的DNA数据库DDBJ(DNADataBaseofJapan)和基因序列数据库GS-DB等。可以预期,这些数据库将在有害生物如病毒、类病毒、植原体(Phytoplasma)和细菌的分类和鉴定方面起越来越重要的作用,特别是在种下水平的变异识别上可能对检疫决策具有重要意义。如中国的检疫性有害生物香蕉细菌性枯萎病(Ralstomasolanacearum)就是该病原的小种2。