課題裡的主變數分子無法確定?
10秒鐘給你一個基於單細胞層次的主變數分子
Hi,大家好,這期是晨曦單細胞資料庫系列的第五期,我們這一階段的目的就是為大家打下堅固的單細胞分析基礎,而生信分析的核心自然是資料,所以我們這裡會花費一部分的時間來講解資料的各種來源,雖然枯燥,但是如果細心學習,想必會帶給你更長遠的提高~
晨曦單細胞資料庫系列傳送門
那麼話不多說,我們就請出我們今天的主角——SC2disease資料庫
該資料是由
西北工業大學、西安交通大學、哈爾濱工業大學、復旦大學、天津大學等團隊合作開發的首個包含細胞型別特異資訊的疾病基因資料庫
,
旨在提供病病例與健康對照之間、病例中不同細胞型別之間以及不同病理程度病例之間基因表達的差異
其中包含了
946481條目
,對應於
341種細胞型別
、
29 種組織
和
25 種疾病
每個條目包含10個部分,分別是:疾病名稱,實驗組織,細胞型別,基因名稱,用於描述基因表達的變數名稱(log2FC或均值),變數的值,差異表達基因(DEG)的比較,PMID,測序平臺和詳細資訊,其中的詳細資訊部分包含有關細胞型別,疾病和基因的詳細資訊
晨曦解讀
透過閱讀這篇關於SC2disease資料庫的文獻,我們可以知道,這個資料庫主要是把目前已經發表單細胞測序資料,利用同樣的pipline進行了整理,目的是闡明疾病和正常細胞之間有無表達差異
下面這個圖也詳細的展示了該資料庫是如何搜尋、獲取、整理資料的流程
其實這個資料庫說的直白一點,就是把已經公開的scRNA-seq的資料進行了統一的加工,並且獲得了基因在不同的疾病細胞以及正常細胞當中的表達情況,然後我們透過檢索來獲取這些作者分析好的結果,本質上來說屬於一個數據庫型別的文章
提問:晨曦,有沒有更直白的、告訴我這個資料庫能幹什麼?
回答:安排!
該資料主要可以幫助我們獲取以下資訊(重點)
1.瀏覽感興趣的Gene
2.搜尋細胞型別的marker
3.瀏覽多種疾病下的marker
4比較疾病和非疾病狀態下各種型別細胞的表達譜(納尼!,這豈不是幫助我們把差異分析都完成了~)
綜上所述:
SC2disease的橫空出世為研究人類疾病相關的細胞型別中的特異性基因提供了有力的支援
乾貨來襲預警
主頁面
首先,我們鍵入網址
http://easybioai.com/sc2disease/
進入SC2disease資料庫介面
晨曦解讀
可以看到該資料所納入的疾病型別,頁面下拉,可以看到該資料庫的介紹資訊以及該資料庫整體的一個數據分佈型別和排布,如下圖所示
至此,主頁面介紹完畢
Browse(瀏覽)
這個介面可以瀏覽資料庫存在的所有資料的結果,介面如下:
然後我們可以選擇左邊的篩選欄來選擇我們想要的疾病種類和細胞型別
至於右邊的結果欄相比較於其它資料庫則顯得”別具一格“
不知道小夥伴們有沒有發現,選擇好想要研究的疾病或者細胞型別後,右邊出來的結果介面是直接展示的DEGs的結果,並且標註好了細胞型別+Gene symbol+logFC等重要資訊
隨後我們點選”details“進入資料詳細頁面:
上面詳細頁面展示了,三大模組的詳細資訊,分別是”疾病“、”細胞型別“、”基因“這三塊的詳細資訊
至此,Browse(瀏覽)介面介紹完畢
Search(檢索)
上面Browse(瀏覽)中檢索還是不夠直接和精確,如果我們想要體驗Pubmed資料庫檢索文獻那樣的檢索模式,我們可以嘗試使用Search(檢索)
我們點選主頁面上的
Search(檢索)
進入檢索介面,介面如下:
在上面這個介面,我們可以透過輸入疾病名稱、基因名稱或細胞型別來訪問資料庫中的資訊
至此,Search(檢索)介面介紹完畢
Download(資料下載)