之前在《一文了解GO/KEGG功能富集分析》裏,我們已經聊過 GO 和 KEGG 的核心概念,還給大家推薦了 DAVID 這個實用工具~
Step1:進入 DAVID 分析頁面
- 打開 DAVID 官網:https://david.ncifcrf.gov/(若網頁加載異常,可刷新重試或檢查網絡)
- 點擊左側功能菜單中的「Functional Annotation」
進入分析主頁面,紅框標註區域就是核心操作區啦~
Step2:三步完成基因列表提交與分析啓動
核心流程:提交基因列表 → 選定基因類型 → 確認並提交具體操作如下:
- 在「Enter Gene List」框中上傳基因列表,格式要求每行一個基因,且總數量不超過 3000 個;
- 點擊「Select Identifier」下拉菜單,選擇基因類型 —— 咱們上傳的是基因名(Gene Symbol),所以找到並勾選「OFFICIAL_GENE_SYMBOL」(菜單較長,耐心找找哦);
- 「List Type」選項中,直接選中「Gene List」單選框;
- 點擊「Submit List」提交即可。
提交後等待幾秒,若彈出提示「Please note that multiple species have been detected in your gene list.」,説明基因列表中檢測到多個物種 —— 點擊「確定」後,在「List」中選中目標物種(此處以「Homo sapiens」為例),再點擊下方「Select Species」就能繼續啦~
Step3:查看核心分析結果
操作完成後,就能看到完整分析結果頁啦!紅框裏的摺疊欄,分別對應 GO(包含 BP、CC、MF 三大類 —— 忘了它們的含義?可以回頭看看《3 分鐘瞭解 GO/KEGG 功能富集分析》補補課~)和 KEGG 的分析結果,一目瞭然~
Step4:提取關鍵結果並下載
做完分析,下一步就是提取目標結果、準備可視化啦!具體操作看這裏:
- 結果頁中,「Gene_Ontology (3 selected)」摺疊欄下,藍框標註的「GOTERM_BP_FAT」「GOTERM_CC_FAT」「GOTERM_MF_FAT」,就是我們需要的 GO 功能富集結果;
- 「Pathways (3 selected)」摺疊欄裏,藍框的「KEGG_PATHWAY」就是 KEGG 的核心結果;
- 想查看每個類別(BP/CC/MF/KEGG)的詳細數據?點擊對應欄目後的「Chart」按鈕(綠框所示)就行~
點擊「Chart」後,會顯示包含多列數據的詳細結果表,核心關注這幾列:
- 關鍵列:Term(GO/KEGG 功能術語)、P-Value(統計顯著性);
- 輔助列:Count(富集的基因數量)、%(富集基因佔比)。
想下載結果?點擊紅框中的「Download File」,會彈出一個純文本格式的結果頁(看似雜亂但數據完整),直接下載或導入作圖軟件,就能進行後續分析啦~
Step5:結果導出與可視化
各位科研小夥伴看文獻時,肯定見過不少功能富集分析的圖吧?柱狀圖、高級氣泡圖是不是很常見?還有人在用 Excel、PPT 慢慢作圖嗎?
下面這種高顏值、高專業度的圖,是不是正是你想要的?