공간 데이터 분석|Seurat을 이용한 공간 단일 세포 연구

세포 집단의 무감독 학습 및 시각화

이 문서에서는 Seurat 패키지의 확장 기능을 소개하며, 특히 다양한 이미징 기술로부터 얻은 공개 데이터셋에 초점을 맞춥니다. 여기서는 Akoya CODEX 시스템을 통한 인간 림프절 데이터셋을 다룹니다.

데이터셋은 Akoya CODEX 시스템으로 생성되었으며, 이 시스템은 멀티플렉싱된 공간 분해능 단백질 분석을 수행할 수 있습니다. 본 데이터셋은 인간 림프절 조직 슬라이스를 보여주며, 28개의 단백질 마커가 포함되어 있습니다. 각 셀의 단백질 강도와 위치 정보는 CSV 파일로 제공됩니다.

먼저 Seurat에서 제공하는 LoadAkoya() 함수를 사용하여 데이터를 불러옵니다.

akoya_data <- ImportAkoyaData(file_path = "/data/LN7910_20_008_11022020_reg001_compensated.csv",
                               data_type = "processor", field_of_view = "HBM754.WKLP.262")

다음으로, 세포 클러스터를 식별하기 위한 비지도 학습을 수행합니다. CLR(normalization based on centered log-ratio) 방법을 통해 데이터를 정규화하고, 주성분 분석(PCA)과 UMAP을 활용한 차원 축소 및 그래프 기반 클러스터링을 진행합니다.

akoya_data <- NormalizeData(dataset = akoya_data, method = "CLR", dimension = 2)
akoya_data <- ScaleDataset(akoya_data)
VariableMarkers(akoya_data) <- rownames(akoya_data)  # 모든 특성을 변수로 취급
akoya_data <- RunPCA(dataset = akoya_data, components = 20, verbose = FALSE)
akoya_data <- RunUMAP(dataset = akoya_data, dimensions = 1:20, verbose = FALSE)
akoya_data <- BuildGraph(akoya_data, dimensions = 1:20, verbose = FALSE)
akoya_data <- IdentifyClusters(dataset = akoya_data, verbose = FALSE, resolution = 0.4, start_points = 1)

클러스터를 UMAP 또는 공간적 위치에 따라 시각화할 수 있습니다.

PlotDimensions(akoya_data, labels = TRUE, label_box = TRUE) + RemoveLegend()

SpatialPlot(akoya_data, colors = "parade")

각 단백질 마커(CD34, CD21, Lyve1 등)의 표현 패턴은 세포 다양성과 그들의 공간적 배열을 명확하게 보여줍니다. 예를 들어, Lyve1은 림프 내피 세포를 나타내며, CD34는 혈관 내피 세포를 나타냅니다. 이러한 결과는 특정 미세 환경인 생발중에서 B 세포의 역할을 확인할 수 있게 합니다.

plot1 <- SpatialFeatureMap(akoya_data, fov_id = "HBM754.WKLP.262", markers = c("CD34", "CD21", "Lyve1"),
                            min_threshold = "q10", max_threshold = "q90")
plot2 <- SpatialPlot(akoya_data, fov_id = "HBM754.WKLP.262", colors = "parade")
plot1 + plot2

이러한 데이터셋들은 세포들이 어떻게 공간적으로 배열되는지를 탐구하는데 유용합니다. 향후 Seurat 업데이트를 통해 더 많은 기능이 추가될 것으로 기대됩니다.

태그: Seurat Akoya CODEX 단백질 분석 PCA UMAP

6월 30일 20:56에 게시됨