尋找差異表達特徵 (Cluster Biomarkers)

本區塊介紹單細胞數據分析中差異表達 (DE) 的基礎。在完成細胞分群後，我們必須找出定義各群的「標誌基因」。理想的標誌物需要具備高靈敏度與高特異性。點擊下方卡片探索不同的比較策略與主流軟體函數。

➚ 比較策略 (DE Strategies)

將特定聚類與剩餘的「所有細胞」進行比較。目標是找出該群**專有**的特徵，通常用於定義大類型的細胞。

比較兩個特定的聚類 (如 Cluster A vs B)。通常用於區分非常相似的亞群 (Subtypes)，尋找細微的特徵差異。

目前主流使用 R 工具包 Seurat 進行標誌物鑑定。

設定適當的門檻 (Thresholds) 可以過濾技術雜訊並加速運算。本區塊透過模擬基因數據，讓您親自調整 logfc.threshold 與 p-value 門檻，觀察標誌基因如何從背景雜訊中被分離出來。

logfc.threshold: 0.25

平均表現量對數差異 (log2FC)。預設 0.25。拉動滑桿觀察圖表變化。

p_val_adj 顯著性門檻: 0.05

校正後的 P 值。需小於此門檻才視為顯著。

X 軸為 Log2 Fold Change，Y 軸為 -Log10(P-value)。紅色/青色點為符合您左側門檻設定的顯著標誌基因。

目標群高表現標誌基因未達顯著門檻基因

scRNA-seq 數據具有高度稀疏性 (Sparse) 與 Dropout 現象。選擇正確的 test.use 模型對分析準確度至關重要。點擊下方列表探索不同的統計模型。

優點

非參數檢定，對數據分布不作假設，運算速度極快，且在多項基準測試中表現優異。

適用場景

絕大多數通用場景，是最穩定且推薦的預設起點。

算出結果矩陣後，真正的挑戰在於生物學解讀。本區解釋表格中的關鍵指標，並列出常用的視覺化驗證方法與最佳實踐建議。

⁂

VlnPlot 觀察表達分布強度

⊙

FeaturePlot UMAP 空間特異性

⊛

DotPlot 表達比例與強度結合

▦

DoHeatmap Top markers 表達矩陣

單細胞分析中細胞數量極大，微小差異也會產生極顯著的 p 值。務必結合 log2FC 與 pct 差異判斷生物學意義。

優質標誌基因應在目標群有高表達率 (如 >70%)，在其他群表達率極低 (如 <20%)。

生信分析只是輔助，最終鑑定需比對 CellMarker、PanglaoDB 等資料庫或文獻，確認基因符合已知細胞特徵。