① 会了GEO数据下载,来看看怎么上传吧
先注册NCBI账号,在: https://www.ncbi.nlm.nih.gov/
然后注册GEO账号,在: https://www.ncbi.nlm.nih.gov/geo/submitter/
GEO可上传的数据类型种类主要集中在芯片和高通量数据,比如芯片数据的四大主流:Affymetrix、Agilent、Nimblegen、Illumina,高通量的RNA-Seq、ChIP-Seq、ATAC-Seq等。另外还有RT-PCR、SAGE数据可以上传
重点需要提交三部分:
基因表达、基因调控、表观以及其他功能基因组学研究,例如
与文章相关的内容
与样本信息相关的内容
样本的实验操作以及建库流程,简单描述即可
数据处理描述,比如基因组版本是什么、怎么比对、怎么过滤、怎么找peaks、怎么定量
数据处理后的文件名称
如果使用了双端测序数据,需要列出各自的名称
首先会看到自己的上传目录,一会将用到
然后设置FileZilla:
此时会发生报错,忽略它
修改Remote site,然后回车连接:
最后就可以将本地数据上传到GEO指定位置了
Tips:为了避免FileZilla上传过程出现中断,可以 设置断点续传
并且会提示再核实一遍信息,没有问题的话5个工作日内就会进行审核
② 如何对GEO数据库中已有的数据进行分析
差异表达基因的筛选(阀值)以及后面的生物信息分析都可以做的。
差异表达基因筛选步骤:选择GEO数据——下载芯片数据——差异分析(方法有很多:SAM法,R包处理,T-test检验等)——选择想要的阈值(Fold change >4)
③ 如何在geo数据库找想要的数据库
1、首先GEO数据库是个什么鬼呢?
GEO数据库全称GENE EXPRESSION
OMNIBUS,是由美国国立生物技术信息中心NCBI创建并维护的基因表达数据库。它创建于2000年,收录了世界各国研究机构提交的高通量基因表达数据,也就是说只要是目前已经发表的论文,论文中涉及到的基因表达检测的数据都可以通过这个数据库中找到。
2、那GEO数据库有哪些检索入口呢?
最常用的有两种方式,如果你知道GSE编号可以通过网址http://www.ncbi.nlm.nih.gov/geo直接进入,具体编号介绍文件下载方法见:https://www.omicsclass.com/article/1100
另外一种就是通过NCBI主页的入口基因搜索下载。通常是不知道GEO编号,通过样品类型,实验处理,平台信息等搜索筛选想要的GEO数据:https://www.ncbi.nlm.nih.gov/,进入NCBI主页,搜索数据选择GEO DataSets,如果搜索某个基因表达量可选择GEO Profiles。