A. 上傳到ncbi上面的dna序列可以更改嗎
可以的
B. 如何向NCBI提交基因組序列
1.整理序列信息:包括病原採集地、病原的寄主、寄主症狀、採集人等基本信息;還有序列分析結果,包括序列全長大小,開放閱讀框(ORF)的長度、位置及特定ORF序列翻譯的氨基酸序列等基因水平的信息,這對於接下來的快速准確提交序列及提交成功後為全世界其他作者准確全面分享此類信息很重要;
2.登陸BackIt站點,注意到頁面右邊的「Sign in to use BankIt」標簽,點擊登錄進入。如果沒有賬號就注冊一個(注意,此賬號與NCBI賬號不通用)。
附 注冊賬號步驟,需要填寫的項目為:
Title:你的職位或頭銜
First name:名
last name:姓
login:登陸名
Affiliation:所屬機構地址,一般填寫自己學校地址
E-mail Address:通信電郵,填完後會發隨機密碼到此電郵地址,使用隨機密碼進行登陸,當然登陸後可對密碼進行重置;
3.登陸BankIt,看到如下圖所示界面,此時NCBI會自動分配一個SubmissionID,但不是最終的提交序列ID:
接下來共有九個步驟(好事多磨):
3.1 Contact Information
填寫個人姓名、機構、電郵等資料集聯系方式,如果錯誤該頁會有ERROR提示直到正確填寫,填寫完畢點擊CONTINUE;
3.2 Reference
填寫參考作者信息(Reference author)及序列相關信息,比如該序列是否對應有文章,如單純提交序列則只需選擇Unpublished即可(Reference title項可以填入「Direct Submission」),有的話就填寫已發表文章的信息(卷、期等),接下來會問你該序列的提交者是否是序列的發現者等信息,填寫完畢點擊CONTINUE;
※提示:新版的BankIt中,接下來會有「Sequencing Technology」一項,呈現有454、Illumina、SOLiD及Other等測序方法選擇,目前為「Sanger dideoxy sequencing」即一代測序方法測序,並且所提交的序列均為「assembled sequences」,目前的「assembly program」為「Lasergene,version 7.0」。
3.3 Nucleotide
包括三個小項:Submission Release Date(期望NCBI什麼時候公布你的序列)、16S
rRNA submissions(該序列是否為16S rRNA)、Sequence(s) and Definition
Line(s)(會提示問你該序列是否為全長genomic
DNA、線狀或環狀等、序列長度,需要復制序列或提交FASTA格式文件),如若序列長度與復制序列或FASTA文件長度不同則會有提示,需要重新提交序列,依次選擇即可。一般選擇「Immediately after Processing」,「非16S rRNA」,「genomic DNA」,「circular」,「complete」等信息,然後將全序列粘貼到下方的空格中,別忘了在上方寫上總核苷酸數。完後審查看有沒有錯誤,繼續CONTINUE;
3.4 Organism
填寫Organism(病原物)的名字,即序列公開顯示時候的標題(如MYVYNV分離物序列「Malvastrum yellow vein Yunnan virus isolate SC226-5, complete genome"),點擊CONTINUE後會出現自動檢索項目,核對後(有可能會進行選擇)繼續CONTINUE;
3.5 Submission Category
提交范疇,是否直接提交或通過第三方Annotation提交(不是太清楚什麼意思,可能指的是從EMBL和DDBJ中導入的數據吧),一般為直接提交,如下圖示選擇Original,繼續CONTINUE;
3.6 Source modifier
選擇該病原物的種類,比如質粒、線粒體等;
Source
modifier下拉菜單及後面的Value設置:進一步選擇該病原物獲取信息,比如Country、Host、Clone、Collection
date、Strain/Isolate等,至少三項(Organelle/Location為細胞器/位置,該項可以不填寫),否則該項不通過,盡量信息全面真實,需要繼續添加則點擊Add,填寫完畢查看下方已填寫表格進行信息核對,然後CONTINUE;
3.7 Primers
PCR引物項目,可選項目,不想填寫可CONTINUE;
3.8 Features(※)
該步驟重要!將用到之前准備的內容,比如序列內ORFs等信息的填寫,並根據之前的選項來填寫該步驟,比如需要將DNA翻譯為氨基酸序列並進行復制粘貼等,該步操作只需將之前准備信息錄入即可,比較耗時;
點擊下方「ADD」鍵,頁面將切換為↓
在這里我們需要錄入更多與該序列有關的信息,最主要的就是錄入之前已經整理好的序列裡面的開放閱讀框(ORF)信息:Genetic Code設置為」Standard「,5'和3'都勾選上,Protein Name/Protein Description項都填寫,將特定區域(ORF)的核苷酸序列翻譯為氨基酸序列後(除去末端的終止子)復制到下方的」Amino Acid Sequence「框中,依次錄入即可。在這里越詳細越好,具體參照實際操作;
3.9 Review and Correct
對已填寫信息進行復核及提交,並被告知在2個工作日之內會收到NCBI電郵,需要進一步對序列進行審查核對;
4.至此,基本序列提交已經完工,剩下的事情就是等待審核,大概兩個工作日後會收到來自NCBI工作人員的電郵,如有問題會通知你進一步修改信息直到完全無誤,包括以後的接受序列號,即你的序列會出現在NCBI裡面世界上唯一的一個界面里。