‘壹’ 蛋白质数据库的内容
Protein Sequence Databases: Antibodies: Sequence and Structure
BRENDA: Enzyme database
CD Antigens: Database of CD antigens
dbCFC: Cytokine family database
Histons: Histone sequence database
HPRD: Human protein reference database
InterPro: Intergrated documentation 5resources for protein families
iProClass: An integrated protein classification database
KIND: A non-rendant protein sequence database
MHCPEP: Database of MHC binding peptides
MIPS: Munich information centre for protein sequences
PIR: Annotated, and non-rendant protein sequence database
PIR-ALN: Curated database of protein sequence alignments
PIR-NREF: PIR nonrendent reference protein database
PMD: Protein mutant database
PRF: Protein research foundation, Japan
ProClass: Non-rendant protein database
ProtoMap: Hierarchical classification of swissprot proteins
REBASE: Restriction enzyme database
RefSeq: Reference sequence database at NCBI
SwissProt: Curated protein sequence database
SPTR: Comprehensive protein sequence database
Transfac: Transcription factor database
TrEMBL: Annotated translations of EMBL nucleotide sequences
Tumor gene database: Genes with cancer-causing mutations
WD repeats: WD-repeat family of proteins Protein Structure Databases: Cath: Protein structure classification
HIV Protease: HIV protease database 3D structure
PDB: 3-D macromolecular structure data
PSI: Protein structure initiative
S2F: Structure to function project
Scop: Structural Classification of Proteins Protein Domains, Motifs & Signatures: BLOCKS: Multipe aligned segments of conserved protein regions
CCD: Conserved domain database and search service
DOMO: Homologous protein domain families
Pfam: Database of protein domains and HMMs
ProDom: Protein domain database
Prints: Protein motif fingerprint database
Prosite: Database of protein families and domains
SMART: Simple molar architecture research tool
TIGRFAM: Protein families based on HMMs Others: Phospho Site: Database of phosphorylation sites
‘贰’ 怎么在ubuntu上安装oracle数据库
安装Oracle所需要的依赖包
sudo apt-get install automake
sudo apt-get install autotools-dev
sudo apt-get install binutils
sudo apt-get install bzip2
sudo apt-get install elfutils
sudo apt-get install expat
sudo apt-get install gawk
sudo apt-get install gcc
sudo apt-get install gcc-multilib
sudo apt-get install g++-multilib
sudo apt-get install ia32-libs
sudo apt-get install ksh
sudo apt-get install less
sudo apt-get install lesstif2
sudo apt-get install lesstif2-dev
sudo apt-get install lib32z1
sudo apt-get install lio1
sudo apt-get install lio-dev
sudo apt-get install libc6-dev
sudo apt-get install libc6-dev-i386
sudo apt-get install libc6-i386
sudo apt-get install libelf-dev
sudo apt-get install libltdl-dev
sudo apt-get install libmotif4
sudo apt-get install libodbcinstq4-1 libodbcinstq4-1:i386
sudo apt-get install libpth-dev
sudo apt-get install libpthread-stubs0
sudo apt-get install libpthread-stubs0-dev
sudo apt-get install libstdc++5
sudo apt-get install lsb-cxx
sudo apt-get install make
sudo apt-get install openssh-server
sudo apt-get install pdksh
sudo apt-get install rlwrap
sudo apt-get install rpm
sudo apt-get install sysstat
sudo apt-get install unixodbc
sudo apt-get install unixodbc-dev
sudo apt-get install unzip
sudo apt-get install x11-utils
sudo apt-get install zlibc
谨慎起见,最好都执行一遍。
3、 检查系统变量
/sbin/sysctl -a | grep sem
/sbin/sysctl -a | grep shm
/sbin/sysctl -a | grep file-max
/sbin/sysctl -a | grep aio-max
/sbin/sysctl -a | grep ip_local_port_range
/sbin/sysctl -a | grep rmem_default
/sbin/sysctl -a | grep rmem_max
/sbin/sysctl -a | grep wmem_default
/sbin/sysctl -a | grep wmem_max
然后根据上面命令中得到的参数值在/etc/sysctl.conf中增加对应数据,比如:
fs.aio-max-nr = 1048576
fs.file-max = 6815744
kernel.shmall = 2097152
kernel.shmmax = 536870912
kernel.shmmni = 4096
kernel.sem = 250 32000 100 128
net.ipv4.ip_local_port_range = 9000 65500
net.core.rmem_default = 262144
net.core.rmem_max = 4194304
net.core.wmem_default = 262144
net.core.wmem_max = 1048586
运行一下命令更新内核参数:
sysctl –p
4、添加对用户的内核限制
添加对dong用户的内核限制在 /etc/security/limits.conf 文件中增加以下数据,注:其中dong是我ubuntu系统的普通用户
dong soft nproc 2047
dong hard nproc 16384
dong soft nofile 1024
dong hard nofile 65536
dong soft stack 10240
5、查看/etc/pam.d/login,增加以下行(有了就不用增加了):
session required pam_limits.so
同样检查/etc/pam.d/su,没有以下行就自己加上:
session required pam_limits.so
6、创建需要的文件夹
makdir ~/tools/oracle11g
7、为Oracle配置环境变量
#oracle安装目录,第6步创建的文件夹
export ORACLE_BASE=/home/dong/tools/oracle11g
#网上说可以随便写
export ORACLE_HOME=$ORACLE_BASE/proct/11.2.0/dbhome_1
#数据库的sid
export ORACLE_SID=orcl
export ORACLE_UNQNAME=orcl
#默认字符集
export NLS_LANG=.AL32UTF8
#环境变量
export PATH=${PATH}:${ORACLE_HOME}/bin/:$ORACLE_HOME/lib64;
8、欺骗oracle的安装程序
Oracle本身并不支持ubuntu来安装,所以要进行欺骗oracle的安装程序(sudo执行):
mkdir /usr/lib64
ln -s /etc /etc/rc.d
ln -s /lib/x86_64-linux-gnu/libgcc_s.so.1 /lib64/
ln -s /usr/bin/awk /bin/awk
ln -s /usr/bin/basename /bin/basename
ln -s /usr/bin/rpm /bin/rpm
ln -s /usr/lib/x86_64-linux-gnu/libc_nonshared.a /usr/lib64/
ln -s /usr/lib/x86_64-linux-gnu/libpthread_nonshared.a /usr/lib64/
ln -s /usr/lib/x86_64-linux-gnu/libstdc++.so.6 /lib64/
ln -s /usr/lib/x86_64-linux-gnu/libstdc++.so.6 /usr/lib64/
echo 'Red Hat Linux release 5' > /etc/RedHat-release
9、 下载Oracle安装程序
从oracle官网上下载Linux x86的那两个文件(64位系统就下Linux x86-64),解压后得到database文件夹。
10、安装Oracle
进入database文件夹,为runInstaller文件赋予可执行权限
chmod 777 runInstaller
11、安装过程可能遇到的问题
一、Oracle安装界面乱码解决方法
执行:
exportNLS_LANG=AMERICAN_AMERICA.UTF8
export LC_ALL=C
二、Error in invoking target ‘install’ of makefile ‘/home/dong/tools/oracle11g/proct/11.2.0/dbhome_1/ctx/lib/ins_ctx.mk’. See ‘/home/dong/tools/oraInventory/logs/installActions2015-01-22_09-39-03AM.log’ for details.
解决方法如下:
使用rpm安装这个glibc-static-2.17-55.el7.x86_64.rpm资源,安装即可,下载见http://www.linuxidc.com/Linux/2015-01/112247.htm
然后点击retry ,接着往下执行
注:这是网上提供的解决方案,我的系统安装失败,我直接跳过了
三、Error in invoking target ‘agent nmhs’ of makefile ‘/home/dong/tools/oracle11g/proct/11.2.0/dbhome_1/sysman/lib/ins_emagent.mk’
解决方法:
打开新的终端窗口
使用vi命令,打开/home/dong/tools/oracle11g/proct/11.2.0/dbhome_1/sysman/lib/ins_emagent.mk文件,将$(MK_EMAGENT_NMECTL)修改成$(MK_EMAGENT_NMECTL)-lnnz11 即可,
然后点击retry ,接着往下执行
四、Error in invoking target ‘all_no_orcl’ of makefile ‘/home/dong/tools/oracle11g/proct/11.2.0/dbhome_1/rdbms/lib/ins_rdbms.mk’. See ‘/home/dong/tools/Inventory/logs/installActions2016-03-19_02-37-44PM.log’ for details.
解决办法:
打开一个新的终端,输入如下四个命令:
sed -i 's/^\(TNSLSNR_LINKLINE.*\$(TNSLSNR_OFILES)\) \(\$(LINKTTLIBS)\)/\1 -Wl,--no-as-needed \2/g' $ORACLE_HOME/network/lib/env_network.mk
sed -i 's/^\(ORACLE_LINKLINE.*\$(ORACLE_LINKER)\) \(\$(PL_FLAGS)\)/\1 -Wl,--no-as-needed \2/g' $ORACLE_HOME/rdbms/lib/env_rdbms.mk
sed -i 's/^\(\$LD \$LD_RUNTIME\) \(\$LD_OPT\)/\1 -Wl,--no-as-needed \2/g' $ORACLE_HOME/bin/genorasdksh
sed -i 's/^\(\s*\)\(\$(OCRLIBS_DEFAULT)\)/\1 -Wl,--no-as-needed \2/g' $ORACLE_HOME/srvm/lib/ins_srvm.mk
然后在图形界面点击‘Retry’就能继续安装了。
五、然后按照安装程序提示最后执行两个脚本:
sudo /home/dong/tools/Inventory/orainstRoot.sh
sudo /home/dong/tools/oracle11g/proct/11.2.0/dbhome_1/root.sh
‘叁’ Oracle企业管理器(OEM)常见问题解答
OracleEnterpriseManager(Oracle企业管理器 简称OEM)是通过一组Oracle程序 为管理分布式环境提供了管理服务 OEM包括了一组DBA工具 一个repository 以及一个图形化显示的控制台 OEM控制台与每一个服务器上的智能化代理(IntelligentAgent)相对应 智能化代理能够监控系统的特定事件并且执行任务(作业)就象你在系统本地一样 事件和作业的结果会被送回控制台 这样可以在一个地方管理所有的系统 OEM与ServerManagerMotif相比 有以下优点 )从适用范围看 OEM可以同时监控管理多个系统上的多个数据库 因而特别适合分布式环境 而ServerManager只能监控管理一个数据库 )从管理对象看 OEM可以监控管理节点 数据库和监听进程(listener) 而ServerManager只能监控数据库 )从适用版本看 OEM可以同时监控管理Oracle x和 x 而从 版开始 ServerManager已不存在 本文主要介绍一些OEM的常见问题及其解决方法 Q OEM数据库工具组的功能是什么? A OEM数据库工具组是一组使DBA能够通过GUI界面管理Oracle数据库的工具 包括以下工具 DataManager(数据管理器) 这工具使你能够象加载数据一样执行数据的export/import SchemaManager 这工具使你能够在数据库中管理对象 可以用于创建 修改 和删除tables indexes views snapshots sequences等等 SecurityManager(安全性管理器) 这工具使你能够管理用户 角色 权限及profiles StorageManager(存储管理器) 这工具允许你创建和修改表空间 数据文件和回滚段 InstanceManager(实例管理器) 这工具允许你关闭 启动实例并且存储和管理数据库参数 SQL*Worksheet 这工具使你能够运行或创造SQL脚本并且存慎察储在硬盘上 你能使用这工具重现最后执行的语句 同时 检查显示到屏幕上的执行结果 BackupManager(备份管理器) 这工具允许你管理备份和恢复为Oracle 和Oracle 数据库 在Oracle 此工具支持EnterpriseBackupUtility(EBU) 在Oracle 此工具支持恢复管理器RecoveryManager SofareManager(软件管理器) 这允许你将远程软件安装到支持这一特性的远程服务器 Q 作业状态一直为提交 未变为预定(scheled) A 作业在OEM控制台创建并旦拿且到被通过SQL*net送至智能化代理 一旦当智能化代理接受作业请求 会发送一个通知回到OEM控制台 状态变化到 预定 如果状态从未从提交变化到预定 那代理程序可能没有收到作业请求 确定代理程序是否已经启动 确定SQL*net和OEM是否已经适当配置 Q 作业状态一直为预定 未变为运行 A 当代理程序开始运行作业的时候 会发送一个通知回到OEM控制台 状态变化到 已发送 或 启动 如果作业状态一直为预定而无变化 那可能是代理程序不能打开一个socket回到OEM控制台 原因可能是TCP/IP问题或代理程序没有足够权限去派生一个进程来运行作业 在服务器端使用主机名来Ping控制台 以此确定TCP/IP不存在问题 确认运行作业的数据库用户具有dba connect resource权限 Q 运行作业出错 错误信息为 FailedtoAuthenticateUser A 在NT系统上 你必须把 Logonasabatchjob 权限授予登录用户 然后在OEMPreferredCredentials中设置此用户 如果代理程序是一个 x的代理程序 那这个用户必须是一个本地的NT用户 不能为一个DOMAIN用户 在Unix系统上 代理程序的权限应为 rwsr xr xrootdba dbsnmp s 权限意味着dbsnmp进程将用root用户的权限运行 当这权限设置以模孝搭后 作业将由在OEM控制台的PreferredCredentials窗口中设置的用户运行 确认在OEM控制台的PreferredCredentials窗口中设置的用户在服务器上有合适的登录权利 Q 客户能创建自己定义的事件吗? A 在OEM x中 客户不能创建自己定义的事件 这将是OEM x的一个新特性 然而 你能创建一个运行TCL脚本的作业 能通过使用TCL命令orareportevent触发一个事件 有关orareportevent的进一步信息 请参阅OEM应用开发者手册 Q 在控制台上 数据库显示为红色的圆圈和斜线 表示数据库已关闭 然而 数据库是正在运行的 A 如果数据库 监听进程或节点显示为红色的圆圈和斜线 OEM控制台是在试图通知你服务已关闭 如果服务未关闭 你需要在事件窗口中单击 OutstandingEventstab 并将通知移动至历史记录 这应该从导 航(navigator)和地图(map)窗口中清除关闭提示 Q 怎样创建OEMRepository? A OEMRepository是在Oracle 或Oracle 数据库中的一组表 这些表存储了通过OEM控制台图形化浏览的信息 在OEM x结构中 这些表存储在一个特定的用户下并且不能与另外的用户共享 在OEM x 应该用一个非 system 用户登录来运行脚本SMPCRE SQL 此用户必须有connect resource和dba权限 在OEM x 初次激活OEM控制台图标时将自动地创建Repository 如果已存在一个早期版本的repository 会提示更新表 如果没有OEM表 会提示创建表 Q 怎样自定义OEM工具栏? A 如果要设定OEM工具栏 应在工具栏上按右键 选择Customizetab 你能编辑工具栏项目的名字 删除项目 或添加项目 如果在Databasetab上单击 可以进入logoncredentials 为每数据库选择一个默认值输入项 Q 当登录至OEM控制台时 得到以下错误信息 VOC Failuretoobtaininterfacelogin A 原因是OEM通信后台进程不能打开一个与Repository的连接 确认TCP/IP配置正确 以及是否通信后台进程的缺省参数已被修改(使用DaemonManager) Q 当使用OEM控制台时 得到以下错误信息 VOC Not connected to ORACLE A 原因是OEMRepository所在数据库已关机 或是连接数据库的服务发生了网络故障 Q 当使用SYSDBA登录至OEM控制台时 得到以下错误信息 VOC ORA Tableorviewdoesnotexist A 用户登录至OEM控制台的缺省角色是NORMAL 如果你需要作为SYSDBA连接 应该在PreferredCredentials窗口中设置CONNECTASSYSDBA选项 lishixin/Article/program/Oracle/201311/17696
‘肆’ 求:一些好的有关于自然科学的英文网站!
自然科学的英文网站请进www.zhaobio.com里面联结很多主类别 子类别
在线数据库与资源在线工具与资源 生命科学数据库豪门 (18) NCBI | EBI | ExPASy | UniProt | TIGR | PIR | 其他 | more...
DNA序列数据库 (16) INSDC三大核酸数据库 | 编码和非编码DNA | 基因结构/内含子/外显子/剪接位点 | 转录调节位点/转录因子 | more...
RNA序列结构数据库 (1) | more...
蛋白质序列数据库 (8) 蛋白序列综合数据库 | 蛋白属性数据库 | 蛋白定位和寻靶(targeting) | 蛋白质模体(motif)/活性位点 | 蛋白质结构域/蛋白分类 | 蛋白质家族数据库 | more...
分子结构数据库 (5) 小分子结构数据库 | 碳水化合物 | 核酸结构 | 蛋白质结构 | more...
植物学在线数据库 (4) 综合性植物学数据库 | 拟南芥数据库 | 水稻数据库 | 其它植物 | more...
基因组学数据库(综合) (2) 基因组综合数据库 | 模式生物基因组/比较基因组学 | 基因注释/本体(ontologies)/命名 | 分类与鉴定 | more...
基因组学数据库(人类/脊椎) (3) 综合数据库(人类/脊椎) | 人类基因组/图谱/浏览器(viewers) | 人类基因组ORFs | 大鼠/小鼠 | 鱼类 | 其它脊椎动物 | more...
基因组学数据库(非脊椎) (1) 综合数据库(非脊椎) | 无脊椎动物基因组 | 真菌基因组 | 单细胞真核生物基因组 | 原核生物基因组 | 病毒基因组 | more...
蛋白质组学数据库 (0) | more...
人类基因与疾病数据库 (0) 人类遗传学综合数据库 | 多态性综合数据库 | 癌基因数据库 | 某些特殊基因/系统/疾病数据库 | more...
基因表达/基因芯片数据库 (0) | more...
代谢与信号传导途径数据库 (0) 酶/酶的命名 | 代谢途径 | 分子间交互作用/信号传导 | more...
细胞器数据库 (0) 线立体基因与蛋白 | more...
免疫学数据库 (0) | more...
其他生物学数据库 (0) 药物/药物设计 | 分子探针/引物 | more...
常用序列分析工具 (15) 在线综合分析工具 | 序列检索(BLAST/SRS) | 多序列比对/进化树 | 启动子分析 | 跨膜区分析 | ORF分析 | 定位分析 | 序列格式化 | 序列提交 | more...
DNA在线工具 (15) 基因组注释(Annotations) | 基因预测 | 基因组作图与拼接(Mapping Assembly) | 构建进化树 | 特征序列挖掘 | 序列多态性分析 | 序列检索和提交 | 实用工具 | Tools For the Bench | more...
RNA在线工具 (2) 功能RNA | 综合性RNA资源 | RNA序列检索工具 | RNA Motif | RNA分子设计/结构预测与显示 | more...
蛋白质在线分析工具 (4) 蛋白质二极结构预测 | 蛋白质三维结构预测与比较 | 蛋白质三维结构检索与查看 | 蛋白质生化特性 | All-in-one蛋白分析工具 | 结构域与模体 | 蛋白功能定位等预测 | 交互作用/代谢途径/酶 | 定位与靶标 | 进化树 | 蛋白序列/比对数据格式化 | 蛋白表达 | 蛋白质组工具 | 蛋白质特征序列 | 蛋白质序列检索 | more...
基因组学工具 (0) 果蝇/蚊虫基因组工具 | more...
基因表达/芯片工具 (1) cDNA/EST/SAGE | 基因表达调控 | 基因芯片 | 蛋白表达 | 剪接 | more...
其他分子相关工具 (0) | more...
文献数据库与检索工具 (1) | more...
生物学相关计算机资源 (0) | more...
教育培训资源 (0) | more...
其它网站 (10) 门户网站 | 论坛 | 博客/个人网站 | more...
‘伍’ 蛋白质序列数据库包含哪些内容
蛋白质数据库
1. PIR和PSDPIR国际蛋白质序列数据库(PSD)是由蛋白质信息资源(PIR)、慕尼黑蛋白质序列信息中心(MIPS)和日本国际蛋白质序列数据库(JIPID)共同维护的国际上最大的公共蛋白质序列数据库。这是一个全面的、经过注释的、非冗余的蛋白质序列数据库,包含超过142,000条蛋白质序列(至99年9月),其中包括来自几十个完整基因组的蛋白质序列。所有序列数据都经过整理,超过99%的序列已按蛋白质家族分类,一半以上还按蛋白质超家族进行了分类。PSD的注释中还包括对许多序列、结构、基因组和文献数据库的交叉索引,以及数据库内部条目之间的索引,这些内部索引帮助用户在包括复合物、酶-底物相互作用、活化和调控级联和具有共同特征的条目之间方便的检索。每季度都发行一次完整的数据库,每周可以得到更新部分。
PSD数据库有几个辅助数据库,如基于超家族的非冗余库等。PIR提供三类序列搜索服务:基于文本的交互式检索;标准的序列相似性搜索,包括BLAST、FASTA等;结合序列相似性、注释信息和蛋白质家族信息的高级搜索,包括按注释分类的相似性搜索、结构域搜索GeneFIND等。
PIR和PSD的网址是:http://pir.georgetown.e/。
数据库下载地址是:ftp://nbrfa.georgetown.e/pir/。
2. SWISS-PROT
SWISS-PROT是经过注释的蛋白质序列数据库,由欧洲生物信息学研究所(EBI)维护。数据库由蛋白质序列条目构成,每个条目包含蛋白质序列、引用文献信息、分类学信息、注释等,注释中包括蛋白质的功能、转录后修饰、特殊位点和区域、二级结构、四级结构、与其它序列的相似性、序列残缺与疾病的关系、序列变异体和冲突等信息。SWISS-PROT中尽可能减少了冗余序列,并与其它30多个数据建立了交叉引用,其中包括核酸序列库、蛋白质序列库和蛋白质结构库等。
利用序列提取系统(SRS)可以方便地检索SWISS-PROT和其它EBI的数据库。
SWISS-PROT只接受直接测序获得的蛋白质序列,序列提交可以在其Web页面上完成。
SWISS-PROT的网址是:http://www.ebi.ac.uk/swissprot/。
3. PROSITE
PROSITE数据库收集了生物学有显着意义的蛋白质位点和序列模式,并能根据这些位点和模式快速和可靠地鉴别一个未知功能的蛋白质序列应该属于哪一个蛋白质家族。有的情况下,某个蛋白质与已知功能蛋白质的整体序列相似性很低,但由于功能的需要保留了与功能密切相关的序列模式,这样就可能通过PROSITE的搜索找到隐含的功能motif,因此是序列分析的有效工具。PROSITE中涉及的序列模式包括酶的催化位点、配体结合位点、与金属离子结合的残基、二硫键的半胱氨酸、与小分子或其它蛋白质结合的区域等;除了序列模式之外,PROSITE还包括由多序列比对构建的profile,能更敏感地发现序列与profile的相似性。PROSITE的主页上提供各种相关检索服务。
PROSITE的网址是:http://www.expasy.ch/prosite/。
4. PDB
蛋白质数据仓库(PDB)是国际上唯一的生物大分子结构数据档案库,由美国Brookhaven国家实验室建立。PDB收集的数据来源于X光晶体衍射和核磁共振(NMR)的数据,经过整理和确认后存档而成。目前PDB数据库的维护由结构生物信息学研究合作组织(RCSB)负责。RCSB的主服务器和世界各地的镜像服务器提供数据库的检索和下载服务,以及关于PDB数据文件格式和其它文档的说明,PDB数据还可以从发行的光盘获得。使用Rasmol等软件可以在计算机上按PDB文件显示生物大分子的三维结构。
RCSB的PDB数据库网址是:http://www.rcsb.org/pdb/。
5. SCOP
蛋白质结构分类(SCOP)数据库详细描述了已知的蛋白质结构之间的关系。分类基于若干层次:家族,描述相近的进化关系;超家族,描述远源的进化关系;折叠子(fold),描述空间几何结构的关系;折叠类,所有折叠子被归于全α、全β、α/β、α+β和多结构域等几个大类。SCOP还提供一个非冗余的ASTRAIL序列库,这个库通常被用来评估各种序列比对算法。此外,SCOP还提供一个PDB-ISL中介序列库,通过与这个库中序列的两两比对,可以找到与未知结构序列远缘的已知结构序列。
SCOP的网址是:http://scop.mrc-lmb.cam.ac.uk/scop/。
6. COG
蛋白质直系同源簇(COGs)数据库是对细菌、藻类和真核生物的21个完整基因组的编码蛋白,根据系统进化关系分类构建而成。COG库对于预测单个蛋白质的功能和整个新基因组中蛋白质的功能都很有用。利用COGNITOR程序,可以把某个蛋白质与所有COGs中的蛋白质进行比对,并把它归入适当的COG簇。COG库提供了对COG分类数据的检索和查询,基于Web的COGNITOR服务,系统进化模式的查询服务等。
COG库的网址是:http://www.ncbi.nlm.nih.gov/COG。
下载COG库和COGNITOR程序在:ftp://ncbi.nlm.nih.gov/pub/COG。