ncbi数据库下载

发布时间: 2023-08-06 02:27:27

A. 如何从ncbi上下载database

因此NCBI 的分类学数据库不是一个系统发育或分类学的“专家数据库”（Wheeler et al., 2000）。获取序列所对应的分类学信息有两种方法。一种方法，从NCBI 网站下载gi与taxid 对应表，在Taxonomy 数据库的FTP 地址下载。这个目录下有多个压缩文件，其中针对Windows 操作系统的两个针对蛋白质序列和核苷酸序列的压缩文件分别是gi_taxid_prot.dmp.gz 和gi_taxid_nucl.dmp.gz 文件。这两个文件都只有两列，左边为gi 号，右边为Taxid。由于这些文件非常大，因此用浏览器来打开这些文件几乎是不可能的。随着时间的推移，这两个文件会越来越大，不过速度不会是指数增长的，并且在美国东部时间的每个星期一2：00 am NCBI 会对其进行更新。对于Windows 用户还有一个文件称为taxmp.zip 文件。文件解压缩后包括1 个*.prt 文件和6 个*.dmp 文件。Gencode.dmp 文件保存有不同的密码子表，与同目录的gc.prt 联合使用；merged.dmp 是保存有合并的taxid 号的对应表；nodes.dmp 是结点信息；division.dmp 是较大的几个分类；names.dmp 结点名称信息，每个id 对应多行。这些数据被Phylogenie 软件包中的blammer 程序用于构建进化树。利用ftp 地址的连接利用Http 或ftp 方式将文件下载到本地，通过本地程序或脚本搜索文本，来建立gi 号与Taxid 之间的联系（图）。这种方法比较适合于在线服务的Web 形式的程序，通过在本地不断地及时更新程序就可以完成这项工作。第二种方法是对Taxonomy 数据库进行API 分析。

B. 如何在geo数据库找想要的数据库

1、首先GEO数据库是个什么鬼呢？
GEO数据库全称GENE EXPRESSION
OMNIBUS，是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。它创建于2000年，收录了世界各国研究机构提交的高通量基因表达数据，也就是说只要是目前已经发表的论文，论文中涉及到的基因表达检测的数据都可以通过这个数据库中找到。
2、那GEO数据库有哪些检索入口呢？
最常用的有两种方式，如果你知道GSE编号可以通过网址http://www.ncbi.nlm.nih.gov/geo直接进入，具体编号介绍文件下载方法见：https://www.omicsclass.com/article/1100
另外一种就是通过NCBI主页的入口基因搜索下载。通常是不知道GEO编号，通过样品类型，实验处理，平台信息等搜索筛选想要的GEO数据：https://www.ncbi.nlm.nih.gov/，进入NCBI主页，搜索数据选择GEO DataSets，如果搜索某个基因表达量可选择GEO Profiles。

阅读全文

ncbi数据库下载

与ncbi数据库下载相关的内容