REFERENCES

Spatial Transcriptomics References Index

為 ST Interactive Tutorial 15 個章節提供原始論文、官方文件、benchmark 與資料集的完整佐證——含 Visium / Visium HD / Xenium / MERFISH / CosMx / Slide-seq / Stereo-seq 平台與全套分析工具。

References, citations, and sources for the Spatial Transcriptomics Interactive Tutorial — papers, official documents, and benchmarks with DOI / URL links.

如何使用這份資料?

本頁針對教學中提到的每個工具、演算法與生物學概念,整理學術出處供讀者深入查閱。引用標籤含義:

For every tool, algorithm, and biological concept mentioned in the tutorial, this page collects academic sources for deeper reading. Citation tag meanings:

📄

Paper

原始論文 · 含 DOI / PubMed

Primary papers with DOI / PubMed

📘

Doc

官方文件、vignette、tutorial

Official documentation, vignettes, tutorials

Best Practice

系統性綜述或 community 推薦

Systematic reviews and community-recommended practices

📊

Benchmark

方法評比 / 獨立 benchmarking

Method comparisons and independent benchmarking

🗄️

Database

公開資料集 / atlas

Public datasets and atlases

📚

Book

線上免費書籍與綜合教材

Free online books and comprehensive textbooks

本頁目錄

⭐ Best Practices 綜述論文

整體 ST 分析流程的權威性綜述與線上書籍。建議從這幾篇開始建立全景觀。

Authoritative reviews and online books covering the full ST analysis workflow. Start with these to build a panoramic view.

🧰 核心分析框架

ST 分析的軟體生態系:Seurat (R)、Scanpy (Python) 各自有專屬 spatial 模組;Squidpy 是 Scanpy 的 spatial 擴充;SpatialData 提供統一資料容器;Giotto 是 R 端較完整的 spatial 套件。

The ST analysis software ecosystem: Seurat (R) and Scanpy (Python) each have dedicated spatial modules; Squidpy is the spatial extension for Scanpy; SpatialData provides a unified data container; Giotto is the more comprehensive spatial package on the R side.

🌐 總覽 (Overview)

🔬 平台比較 (Platforms)

平台選擇與綜合比較

個別平台原始論文

🧪 品質管控 (Quality Control)

⚖️ 標準化 (Normalization)

📉 降維與特徵 (Dimensionality Reduction)

🧩 空間區域辨識 (Spatial Domains)

主流方法

Benchmark

✨ 空間變異基因 (Spatially Variable Genes)

🧬 細胞類型解卷積 (Deconvolution)

🔗 與 scRNA-seq 整合 (sc-Spatial Integration)

💬 空間細胞通訊 (Cell-Cell Communication)

🏘️ 生態棲位 (Niche & Microenvironment)

🛤️ 空間軌跡 (Spatial Trajectory)

🧱 多樣本整合與 3D 重建 (Multi-sample / 3D)

✂️ 細胞切割 (Cell Segmentation)

🖼️ Visium HD 與病理影像整合 (HD & Histology)

Visium HD 工作流程

H&E 影像與 vision-omics

🗄️ 公開資料集 / Atlas

📌 教學註記與細節

下方為閱讀本 Spatial Transcriptomics 教學 HTML 與本 reference 比對後,發現的可能不完整、易誤解或可加強之處。不修改原教學檔案,僅在此說明以利參照。

Below are points discovered while cross-checking the tutorial HTML against this reference list — places that may be incomplete, easily misread, or worth expanding. The original tutorial files are not modified; clarifications are provided here for cross-reference.

補充說明 · Notes

Visium spot ≠ single cell:解析度的真實意義

教學以 10x Visium 為 spatial transcriptomics 入門平台。需釐清關鍵概念:標準 Visium 的 55 μm spot 在大多數組織內覆蓋 1–10 個細胞,並非單細胞解析度。實務影響:(1) 一個 spot 的表達 profile 是 多細胞混合訊號,cluster 直接對應「組織區域」而非「細胞型別」;(2) 後續若要解構成 cell-type proportions,必須做 deconvolution(cell2location、RCTD、SpatialDWLS);(3) Visium HD (2024) 將 capture 縮至 2 μm bin,可近似 subcellular,但需 binning 至 8/16 μm 才有穩定 UMI 數;單細胞解析度仍以 Stereo-seq、Slide-seqV2、Xenium 較直接。Ståhl et al. 2016 Science 353:78(原始 ST 技術)

補充說明 · Notes

MERFISH / Xenium(imaging)vs Visium / Slide-seq(sequencing)

教學常將「spatial transcriptomics」當成一個技術類,實則 分為兩大典範,資料屬性與分析流程根本不同:
(1) Sequencing-based(NGS 讀出)—Visium、Slide-seq、Stereo-seq、HDST、DBiT-seq:對 capture spot/bead 上 RNA 加 spatial barcode 後 cDNA → NGS;覆蓋全轉錄組(~20k 基因,untargeted),但解析度受 spot 大小限制(2–100 μm),每個位點 UMI 計數低;下游近似 scRNA-seq matrix。
(2) Imaging-based / single-molecule FISH—MERFISH、seqFISH+、10x Xenium、Vizgen MERSCOPE、NanoString CosMx:用 targeted probe panel (100–1000 基因) + 多輪 hybridization 顯微鏡讀出,提供 真正 subcellular (~100–300 nm)、單分子計數、但僅限預選基因。
影響:(a) imaging-based 不適合 hypothesis-free 探索新 marker;(b) sequencing-based 不能談 subcellular localization;(c) cell segmentation 在 imaging-based 是核心問題(Baysor / Cellpose),sequencing-based 則做 deconvolution。Chen et al. 2015 Science 348:aaa6090(MERFISH); Janesick et al. 2023 Nat Commun 14:8353(Xenium)

補充說明 · Notes

Deconvolution:cell2location vs RCTD vs SpatialDWLS

由於 Visium spot 為多細胞混合,deconvolution(從 reference scRNA-seq 估計每個 spot 的 cell-type proportions)是核心後續分析。教學若僅提一種方法易誤導,三大方法取捨:
cell2location (Kleshchevnikov 2022 Nat Biotechnol 40:661)—Bayesian hierarchical model + variational inference,明確 model spot-level total mRNA count 與 technology-specific over-dispersion,估計 絕對細胞數 而非僅比例;適合稀有細胞型,需 GPU、收斂時間長。
RCTD (Cable 2022 Nat Biotechnol 40:517)—Poisson regression + constrained MLE,分 doublet/full mode,速度快、CPU 即可;單 mode 假設 spot ≤2 種 cell type,Visium 可能不適
SpatialDWLS (Dong & Yuan 2021 Genome Biol 22:145)—weighted least squares,速度最快但對 reference imbalance 敏感。
Benchmark (Li et al. 2022 Nat Methods 19:662):cell2location 在 cell-type detection 與絕對量化最準確;RCTD 在計算效率最佳;SPOTlight 在跨平台一致性較弱。所有方法皆 依賴 reference scRNA-seq 的細胞型涵蓋完整性,缺失型別會被強制分配給最接近者。

補充說明 · Notes

Niche / CCC:COMMOT、CellChat、NICHES 假設不可忽略

教學常以「spatial 可以做 cell-cell communication (CCC)」為賣點,但 多數 CCC 工具(CellChat、NicheNet、CellPhoneDB)原為 scRNA-seq 設計,無空間資訊,僅以 ligand–receptor 共表達推論「可能交互作用」。空間版本如:
COMMOT (Cang et al. 2023 Nat Methods 20:218)—optimal transport-based,明確將細胞間距離納入 ligand-receptor flux 推論,假設訊號為 unbalanced OT 過程、空間衰減 kernel 為 exponential;參數選擇(衰減尺度、receptor saturation)強烈影響結果。
NICHES (Raredon 2023 Bioinformatics 39:btac775)—把每對 neighboring cells 變成新 observation,便於後續 ML 分析。
共同陷阱:(1) ligand-receptor 共表達 ≠ 實際 signaling,無下游通路活化證據;(2) 訊息單向性常被忽略;(3) RNA-level 共表達 ≠ protein-level 互作(如分泌型 ligand 可能來自遠處);(4) Visium 解析度下,spot 內訊號是混合,不能直接讀為「細胞A→細胞B」。建議與 ATAC、proteomics、實驗驗證(共培養、活體 reporter)整合。

補充說明 · Notes

Panel bias:Xenium / MERSCOPE 受限於預選基因

imaging-based 技術(Xenium、MERSCOPE、CosMx)的關鍵限制:整個實驗只能測量預先設計的 panel(通常 100–1000 基因),這直接造成 結構性 selection bias:(1) 無法發現未被 panel 包含的新 marker / cell state;(2) cell-type annotation 受限於 panel 對該型別 marker 的涵蓋程度,rare 或 transitional state 容易被 collapse 到鄰近 cluster;(3) panel 在不同組織不通用—Xenium Human Breast panel 用在腎臟結果可信度大幅下降;(4) cross-panel benchmark 困難,因為兩個 panel 的基因集不重合,做 batch correction 也只能在交集上做。實務建議:(a) 先用 Visium / scRNA-seq 探索 → 再用 imaging-based 量化驗證;(b) 自訂 panel 時,需含 housekeeping、所有預期 cell type 的 ≥3 個 markers、cell-state continuum 的轉換 markers;(c) 報告必須宣告 panel composition 與設計依據。Janesick et al. 2023 Nat Commun 14:8353(Xenium breast benchmark vs Visium / scFFPE)

補充說明 · Notes

高解析度 sequencing-based 平台對比

2023–2024 出現多個 sub-cellular sequencing-based 平台,常被混淆,技術細節對比:
Visium HD (10x, 2024)—2 μm × 2 μm capture squares 連續排列(無 gap)、推薦 binning 至 8 μm / 16 μm 分析;面積 6.5 × 6.5 mm;untargeted whole transcriptome;FFPE compatible;資料量極大(單樣本可達 TB 級 raw images + UMI matrix),需要 Space Ranger 3.0+。
Stereo-seq (BGI, Chen et al. 2022 Cell 185:1777)—DNA nanoball (DNB) chip,~220 nm spot 中心距、~500 nm spot 直徑;面積可達 cm² 級(適合整個小鼠胚胎切片);whole transcriptome;data analysis 以 Stereopy / SAW pipeline 為主。
Slide-seqV2 (Stickels et al. 2021 Nat Biotechnol 39:313)—10 μm beads 隨機排列,解析度單細胞級但 capture efficiency 約 Visium 一半;面積較小(~3 mm puck);2024 之後使用度下降。
取捨:(a) Visium HD 與 10x 生態整合最完整、商業支援;(b) Stereo-seq 解析度最高、適合 organ-scale 但 pipeline 較 BGI 專屬;(c) 三者皆需 binning 才能達到統計穩定 UMI;naive 2 μm bin 分析會極度 sparse;(d) FFPE support 目前 Visium HD 最成熟,Stereo-seq 主要 fresh frozen。