① 會了GEO數據下載,來看看怎麼上傳吧
先注冊NCBI賬號,在: https://www.ncbi.nlm.nih.gov/
然後注冊GEO賬號,在: https://www.ncbi.nlm.nih.gov/geo/submitter/
GEO可上傳的數據類型種類主要集中在晶元和高通量數據,比如晶元數據的四大主流:Affymetrix、Agilent、Nimblegen、Illumina,高通量的RNA-Seq、ChIP-Seq、ATAC-Seq等。另外還有RT-PCR、SAGE數據可以上傳
重點需要提交三部分:
基因表達、基因調控、表觀以及其他功能基因組學研究,例如
與文章相關的內容
與樣本信息相關的內容
樣本的實驗操作以及建庫流程,簡單描述即可
數據處理描述,比如基因組版本是什麼、怎麼比對、怎麼過濾、怎麼找peaks、怎麼定量
數據處理後的文件名稱
如果使用了雙端測序數據,需要列出各自的名稱
首先會看到自己的上傳目錄,一會將用到
然後設置FileZilla:
此時會發生報錯,忽略它
修改Remote site,然後回車連接:
最後就可以將本地數據上傳到GEO指定位置了
Tips:為了避免FileZilla上傳過程出現中斷,可以 設置斷點續傳
並且會提示再核實一遍信息,沒有問題的話5個工作日內就會進行審核
② 如何對GEO資料庫中已有的數據進行分析
差異表達基因的篩選(閥值)以及後面的生物信息分析都可以做的。
差異表達基因篩選步驟:選擇GEO數據——下載晶元數據——差異分析(方法有很多:SAM法,R包處理,T-test檢驗等)——選擇想要的閾值(Fold change >4)
③ 如何在geo資料庫找想要的資料庫
1、首先GEO資料庫是個什麼鬼呢?
GEO資料庫全稱GENE EXPRESSION
OMNIBUS,是由美國國立生物技術信息中心NCBI創建並維護的基因表達資料庫。它創建於2000年,收錄了世界各國研究機構提交的高通量基因表達數據,也就是說只要是目前已經發表的論文,論文中涉及到的基因表達檢測的數據都可以通過這個資料庫中找到。
2、那GEO資料庫有哪些檢索入口呢?
最常用的有兩種方式,如果你知道GSE編號可以通過網址http://www.ncbi.nlm.nih.gov/geo直接進入,具體編號介紹文件下載方法見:https://www.omicsclass.com/article/1100
另外一種就是通過NCBI主頁的入口基因搜索下載。通常是不知道GEO編號,通過樣品類型,實驗處理,平台信息等搜索篩選想要的GEO數據:https://www.ncbi.nlm.nih.gov/,進入NCBI主頁,搜索數據選擇GEO DataSets,如果搜索某個基因表達量可選擇GEO Profiles。