❶ 轉錄組測序所得的數據,怎樣傳到NCBI的SRA資料庫
xshell連接NCBI伺服器 輸入命令 ftp
連接成功後輸入賬號 密碼
mkdir命令創建一個文件夾,以你的BioProject accession命名
FTP 連接成功後連接成功後
進入剛才建立的BioProject文件夾
把原始數據拖進去即可
傳輸過程中,如果一定時間(五分鍾?)沒有激活傳輸界面,可能會導致連接斷開
進度可能會一直停在99%,重新連接成功後,也一直卡在99%,不過似乎數據還是上傳成功了的
傳輸成功的會顯示linked,同時FTP里對應的文件會消失 傳輸成功的會顯示linked,同時FTP里對應的文件會消失
全部文件夾都傳輸成功了會變成queued
然後就等NCBI處理了
❷ 如何向NCBI提交序列
1.整理序列信息:包括病原採集地、病原的寄主、寄主症狀、採集人等基本信息;還有序列分析結果,包括序列全長大小,開放閱讀框(ORF)的長度、位置及特定ORF序列翻譯的氨基酸 序列等基因水平的信息,這對於接下來的快速准確提交序列及提交成功後為全世界其他作者准確全面分享此類信息很重要;
2.登陸BackIt站點,注意到頁面右邊的「Sign in to use BankIt」標簽,點擊登錄進入。如果沒有賬號就注冊一個(注意,此賬號與ncbi 賬號不通用)。
附 注冊賬號步驟,需要填寫的項目為:
Title:你的職位或頭銜
First name:名
last name:姓
login:登陸名
Affiliation:所屬機構地址,一般填寫自己學校地址
E-mail Address:通信電郵,填完後會發隨機密碼到此電郵地址,使用隨機密碼進行登陸,當然登陸後可對密碼進行重置;
3.登陸BankIt,看到如下圖所示界面,此時NCBI會自動分配一個SubmissionID,但不是最終的提交序列ID:
接下來共有九個步驟(好事多磨):
3.1 Contact Information
填寫個人姓名、機構、電郵等資料集聯系方式,如果錯誤該頁會有ERROR提示直到正確填寫,填寫完畢點擊CONTINUE;
3.2 Reference
填寫參考作者信息(Reference author)及序列相關信息,比如該序列是否對應有文章,如單純提交序列則只需選擇Unpublished即可(Reference title項可以填入「Direct Submission」),有的話就填寫已發表文章的信息(卷、期等),接下來會問你該序列的提交者是否是序列的發現者等信息,填寫完畢點擊CONTINUE;
※提示:新版的BankIt中,接下來會有「Sequencing Technology」一項,呈現有454、Illumina、SOLiD及Other等測序方法選擇,目前為「Sanger dideoxy sequencing」即一代測序方法測序,並且所提交的序列均為「assembled sequences」,目前的「assembly program」為「Lasergene,version 7.0」。
❸ 如何提交基因序列到NCBIGENBANK上
許多期刊在文章發表之前需要在文章中有序列的登錄號,並且要求你在文章發表時,序列可以被讀者索取。
NCBI的GenBank提供了兩個投遞方式:
1、在線投遞-BankIt,特點是比較方便。
2、本地投遞文件生成程序——Sequin。目前NCBI seqin有MAC, PC和UNIX不同版本。其輸出文件需要你通過電子郵件發給NCBI.
另外,上面所述一般適用於研究單個或多個功能基因的情況。如果大規模的測序如EST、 STS和GSS序列分別有專門的投遞途徑。
另外,提醒你的兩個問題:
1、對你所投序列所屬物種分類(拉丁名)要有所了解,這通常是出錯的地方(seqin)
2、在你投遞序列到發表文章之間,要注意NCBI發給你的電子郵件,它會詢問你在什麼時間將序列公布。
具體細節你可以瀏覽參考資料所指連接。
❹ 如何上傳測序數據至NCBI
https://www.ncbi.nlm.nih.gov/account/ ,點擊「 Register for a NCBI account」,進入到注冊頁面,如實填寫信息。(盡量使用項目提交人的信息進行注冊)
https://submit.ncbi.nlm.nih.gov/subs/bioproject/ ,在界面上選擇 new submission ,依次填寫SUBMITTER、PROJECT TYPE、TARGET、GENERAL INFO等信息,後面的BIOSAMPLE和PUBLICATIONS兩個界面可以不寫相關信息,都直接點Continue,進入OVERVIEW界面。如果有問題可返回修改,沒問題的話即可點擊submit提交。
創建成功後,再次進入該網址,會出現BioProject編號,以PRJNA開頭,可放在文章中。(注冊人的郵箱會收到相關郵件)
https://submit.ncbi.nlm.nih.gov/subs/biosample/ ,在界面選擇 new submission。大致提交過程如下截圖所示,最終提交完成後,每個樣本會有一個樣本編號,以SAMN開頭,用於後面提交原始數據。
https://www.ncbi.nlm.nih.gov/Traces/sra_sub/sub.cgi ,選擇 NCBI PDA入口,填寫個人信息後,點擊 create new submission >> New submission。
數據上傳比較慢,等數據都上傳完成後,再點擊「Select preload folder」,即可出現上傳好的原始數據,點擊「Use selected folder」,繼續即可。
注意:數據上傳完成之後,NCBI還需要一段時間對數據進行processing,若頁面提示"error"(比如提示數據文件格式有問題),只能發郵件聯系 [email protected] ,數據上傳成功會出現"processed"標志,每個樣本會對應獲得一個SRR編號。SRA處理郵件的效率還是很高的。
❺ NCBI怎麼算上傳成功
進度條。
1、NCBI會有近進度條顯示,如果進度條還沒有都變成黃色,就是沒有上傳成功。
2、如果進度條全都變成了黃色那就是上傳成功了,也會有提示。
❻ ncbi提交序列問題
這封郵件是告訴你已經提交序列成功了,查找這個序列的ID (也就是 Genbank accession number
)是
BankIt1691102 BankIt1691102 KJ195333 (Genbank accession number一般是2位字母+6位數字,即KJ195333, 前面那一串不知道是什麼東東)
你或者別人寫文章的時候引用你提交的序列時需要註明這個Genbank accession number。
你可以在Genbank向公眾釋放這些序列前提交你的文章。
你上傳的結果並不會自動錄入Genbank。Genbank有專門的工作人員會檢查你上傳的序列以及做好注釋。
由於你沒有指定你提交的序列什麼時候向公眾發表,所以NCBI那邊的人默認是他們把這些數據處理好就自動向公眾發表(也就是大家都可以查得到),若果你不想這樣,請發郵件給他們([email protected])。更多內容請見他們帖出來網址。
大概就是這樣。
❼ 如何將rna-seq的數據提交到ncbi中geo
其實很簡單,
1.首先建立一個meta file,即包含實驗信息的文件
2.將測序的fastq(*.fq或*.fastq)文件准備好,此為原始數據(必須)。
3.將每個fastq文件處理後(去接頭,合並相同序列)的序列整理為SEQ
COUNT兩列的文件即可,此為處理後數據(應該也是必須)
4.將這些文件壓縮為文件包(zip或RAR),命名為:賬戶名(你的GEO賬戶名).rar
5.上傳至ftp://geo:[email protected]/fasp,因為文件較大,推薦使用flashXP;除非網路好,超快。
6.寫一份郵件給GEO的網管:[email protected],說明你的數據已經上傳,讓其盡快發布,
我寫的例子:
Dear
Sir,
We would like to submit our Illumina Genome Analyzer results to your GEO
web site.
We have upload our data file zmyang_files.rar to ftp://geo:[email protected]/fasp under the
GEO account user name xxx.
xxx.rar includes:
Illumina meta file:
GEO_Illumina_metadata.xls
processed data
files:
x.txt
y.txt
z.txt
raw data files in fastq
format:
x.fq
y.fq
z.fq
We want to release our data ASAP.
Thanks.
該流程我已重復n次,親自手寫流程,保證可靠。
實際該流程在GEO網站是有個大概的,但是所言含糊,需分析邏輯而後得其詳。 轉載
❽ 怎樣將微生物菌落分析的宏基因組數據上傳到NCBI上
宏基因組學(Metagenomics)又叫微生物環境基因組學、元基因組學。它通過直接從環境樣品中提取全部微生物的DNA,構建宏基因組文庫,利用基因組學的研究策略研究環境樣品所包含的全部微生物的遺傳組成及其群落功能。它是在微生物基因組學的基礎上發展起來的一種研究微生物多樣性、開發新的生理活性物質(或獲得新基因)的新理念和新方法。其主要含義是: 對特定環境中全部微生物的總DNA(也稱宏基因組,metagenomic)進行克隆,並通過構建宏基因組文庫和篩選等手段獲得新的生理活性物質;或者根據rDNA資料庫設計引物,通過系統學分析獲得該環境中微生物的遺傳多樣性和分子生態學信息。
❾ 如何將測序數據上傳到NCBI的SRA資料庫
一般上傳數據到NCBI SRA的過程需要6步:
1、Create a BioProject for this research
2、Create a BioSample submission for your biological sample(s)
3、Gather Sequence Data Files
4、Enter Metadata on SRA website
a、Create SRA submission
b、Create Experiment(s) and link to BioProject and BioSample
c、Create Run(s)
5、Transfer Data files to SRA
6、Update Submission with PubMed links, Release Date, or Metadata Changes
需要注意的一點是,上傳的過程中很多地方一旦保存或提交就不可以修改,尤其是各處的Alias。但是,可以聯系NCBI的工作人員修改內容。NCBI的工作效率是很高的,一般不超過48小時,就可以得到確認,並拿到登錄號。