❶ 转录组测序所得的数据,怎样传到NCBI的SRA数据库
xshell连接NCBI服务器 输入命令 ftp
连接成功后输入账号 密码
mkdir命令创建一个文件夹,以你的BioProject accession命名
FTP 连接成功后连接成功后
进入刚才建立的BioProject文件夹
把原始数据拖进去即可
传输过程中,如果一定时间(五分钟?)没有激活传输界面,可能会导致连接断开
进度可能会一直停在99%,重新连接成功后,也一直卡在99%,不过似乎数据还是上传成功了的
传输成功的会显示linked,同时FTP里对应的文件会消失 传输成功的会显示linked,同时FTP里对应的文件会消失
全部文件夹都传输成功了会变成queued
然后就等NCBI处理了
❷ 如何向NCBI提交序列
1.整理序列信息:包括病原采集地、病原的寄主、寄主症状、采集人等基本信息;还有序列分析结果,包括序列全长大小,开放阅读框(ORF)的长度、位置及特定ORF序列翻译的氨基酸 序列等基因水平的信息,这对于接下来的快速准确提交序列及提交成功后为全世界其他作者准确全面分享此类信息很重要;
2.登陆BackIt站点,注意到页面右边的“Sign in to use BankIt”标签,点击登录进入。如果没有账号就注册一个(注意,此账号与ncbi 账号不通用)。
附 注册账号步骤,需要填写的项目为:
Title:你的职位或头衔
First name:名
last name:姓
login:登陆名
Affiliation:所属机构地址,一般填写自己学校地址
E-mail Address:通信电邮,填完后会发随机密码到此电邮地址,使用随机密码进行登陆,当然登陆后可对密码进行重置;
3.登陆BankIt,看到如下图所示界面,此时NCBI会自动分配一个SubmissionID,但不是最终的提交序列ID:
接下来共有九个步骤(好事多磨):
3.1 Contact Information
填写个人姓名、机构、电邮等资料集联系方式,如果错误该页会有ERROR提示直到正确填写,填写完毕点击CONTINUE;
3.2 Reference
填写参考作者信息(Reference author)及序列相关信息,比如该序列是否对应有文章,如单纯提交序列则只需选择Unpublished即可(Reference title项可以填入“Direct Submission”),有的话就填写已发表文章的信息(卷、期等),接下来会问你该序列的提交者是否是序列的发现者等信息,填写完毕点击CONTINUE;
※提示:新版的BankIt中,接下来会有“Sequencing Technology”一项,呈现有454、Illumina、SOLiD及Other等测序方法选择,目前为“Sanger dideoxy sequencing”即一代测序方法测序,并且所提交的序列均为“assembled sequences”,目前的“assembly program”为“Lasergene,version 7.0”。
❸ 如何提交基因序列到NCBIGENBANK上
许多期刊在文章发表之前需要在文章中有序列的登录号,并且要求你在文章发表时,序列可以被读者索取。
NCBI的GenBank提供了两个投递方式:
1、在线投递-BankIt,特点是比较方便。
2、本地投递文件生成程序——Sequin。目前NCBI seqin有MAC, PC和UNIX不同版本。其输出文件需要你通过电子邮件发给NCBI.
另外,上面所述一般适用于研究单个或多个功能基因的情况。如果大规模的测序如EST、 STS和GSS序列分别有专门的投递途径。
另外,提醒你的两个问题:
1、对你所投序列所属物种分类(拉丁名)要有所了解,这通常是出错的地方(seqin)
2、在你投递序列到发表文章之间,要注意NCBI发给你的电子邮件,它会询问你在什么时间将序列公布。
具体细节你可以浏览参考资料所指连接。
❹ 如何上传测序数据至NCBI
https://www.ncbi.nlm.nih.gov/account/ ,点击“ Register for a NCBI account”,进入到注册页面,如实填写信息。(尽量使用项目提交人的信息进行注册)
https://submit.ncbi.nlm.nih.gov/subs/bioproject/ ,在界面上选择 new submission ,依次填写SUBMITTER、PROJECT TYPE、TARGET、GENERAL INFO等信息,后面的BIOSAMPLE和PUBLICATIONS两个界面可以不写相关信息,都直接点Continue,进入OVERVIEW界面。如果有问题可返回修改,没问题的话即可点击submit提交。
创建成功后,再次进入该网址,会出现BioProject编号,以PRJNA开头,可放在文章中。(注册人的邮箱会收到相关邮件)
https://submit.ncbi.nlm.nih.gov/subs/biosample/ ,在界面选择 new submission。大致提交过程如下截图所示,最终提交完成后,每个样本会有一个样本编号,以SAMN开头,用于后面提交原始数据。
https://www.ncbi.nlm.nih.gov/Traces/sra_sub/sub.cgi ,选择 NCBI PDA入口,填写个人信息后,点击 create new submission >> New submission。
数据上传比较慢,等数据都上传完成后,再点击“Select preload folder”,即可出现上传好的原始数据,点击“Use selected folder”,继续即可。
注意:数据上传完成之后,NCBI还需要一段时间对数据进行processing,若页面提示"error"(比如提示数据文件格式有问题),只能发邮件联系 [email protected] ,数据上传成功会出现"processed"标志,每个样本会对应获得一个SRR编号。SRA处理邮件的效率还是很高的。
❺ NCBI怎么算上传成功
进度条。
1、NCBI会有近进度条显示,如果进度条还没有都变成黄色,就是没有上传成功。
2、如果进度条全都变成了黄色那就是上传成功了,也会有提示。
❻ ncbi提交序列问题
这封邮件是告诉你已经提交序列成功了,查找这个序列的ID (也就是 Genbank accession number
)是
BankIt1691102 BankIt1691102 KJ195333 (Genbank accession number一般是2位字母+6位数字,即KJ195333, 前面那一串不知道是什么东东)
你或者别人写文章的时候引用你提交的序列时需要注明这个Genbank accession number。
你可以在Genbank向公众释放这些序列前提交你的文章。
你上传的结果并不会自动录入Genbank。Genbank有专门的工作人员会检查你上传的序列以及做好注释。
由于你没有指定你提交的序列什么时候向公众发表,所以NCBI那边的人默认是他们把这些数据处理好就自动向公众发表(也就是大家都可以查得到),若果你不想这样,请发邮件给他们([email protected])。更多内容请见他们帖出来网址。
大概就是这样。
❼ 如何将rna-seq的数据提交到ncbi中geo
其实很简单,
1.首先建立一个meta file,即包含实验信息的文件
2.将测序的fastq(*.fq或*.fastq)文件准备好,此为原始数据(必须)。
3.将每个fastq文件处理后(去接头,合并相同序列)的序列整理为SEQ
COUNT两列的文件即可,此为处理后数据(应该也是必须)
4.将这些文件压缩为文件包(zip或RAR),命名为:账户名(你的GEO账户名).rar
5.上传至ftp://geo:[email protected]/fasp,因为文件较大,推荐使用flashXP;除非网络好,超快。
6.写一份邮件给GEO的网管:[email protected],说明你的数据已经上传,让其尽快发布,
我写的例子:
Dear
Sir,
We would like to submit our Illumina Genome Analyzer results to your GEO
web site.
We have upload our data file zmyang_files.rar to ftp://geo:[email protected]/fasp under the
GEO account user name xxx.
xxx.rar includes:
Illumina meta file:
GEO_Illumina_metadata.xls
processed data
files:
x.txt
y.txt
z.txt
raw data files in fastq
format:
x.fq
y.fq
z.fq
We want to release our data ASAP.
Thanks.
该流程我已重复n次,亲自手写流程,保证可靠。
实际该流程在GEO网站是有个大概的,但是所言含糊,需分析逻辑而后得其详。 转载
❽ 怎样将微生物菌落分析的宏基因组数据上传到NCBI上
宏基因组学(Metagenomics)又叫微生物环境基因组学、元基因组学。它通过直接从环境样品中提取全部微生物的DNA,构建宏基因组文库,利用基因组学的研究策略研究环境样品所包含的全部微生物的遗传组成及其群落功能。它是在微生物基因组学的基础上发展起来的一种研究微生物多样性、开发新的生理活性物质(或获得新基因)的新理念和新方法。其主要含义是: 对特定环境中全部微生物的总DNA(也称宏基因组,metagenomic)进行克隆,并通过构建宏基因组文库和筛选等手段获得新的生理活性物质;或者根据rDNA数据库设计引物,通过系统学分析获得该环境中微生物的遗传多样性和分子生态学信息。
❾ 如何将测序数据上传到NCBI的SRA数据库
一般上传数据到NCBI SRA的过程需要6步:
1、Create a BioProject for this research
2、Create a BioSample submission for your biological sample(s)
3、Gather Sequence Data Files
4、Enter Metadata on SRA website
a、Create SRA submission
b、Create Experiment(s) and link to BioProject and BioSample
c、Create Run(s)
5、Transfer Data files to SRA
6、Update Submission with PubMed links, Release Date, or Metadata Changes
需要注意的一点是,上传的过程中很多地方一旦保存或提交就不可以修改,尤其是各处的Alias。但是,可以联系NCBI的工作人员修改内容。NCBI的工作效率是很高的,一般不超过48小时,就可以得到确认,并拿到登录号。