비음수 행렬 분해(NMF)를 이용한 scRNAseq의 세포 군집화
비음수 행렬 분해(Non-negative Matrix Factorization, NMF)은 행렬 분해 기술로, 데이터 행렬을 두 개 이상의 더 작은 행렬의 곱으로 분해하는 방법입니다. 이 작은 행렬의 요소는 모두 비음수입니다. NMF는 데이터의 구조와 설명성을 유지할 수 있기 때문에 데이터 마이닝 및 특징 추출에 특히 유용합니다.
scRNA-seq 데이터는 일반적으로 고차원 행렬로 표현되며, 각 행은 유전자에 해당하고 각 열은 단일 세포의 유전자 발현 프로필을 나타냅니다. scRNA-seq 데이터에 NMF를 적용할 때의 목표는 원본 유전자 발현 행렬을 유전자 인자 행렬과 세포 계수 행렬로 분해하는 것입니다. 유전자 인자 행렬은 생물학적 과정이나 세포 상태에 해당할 수 있는 유전자 집합을 나타내며, 세포 계수 행렬은 각 세포가 이러한 유전자 집합에 대해 얼마나 활발한지를 설명합니다.
세포 계수 행렬에 대한 클러스터링 분석을 통해 연구자들은 비슷한 발현 패턴을 가진 세포, 즉 세포 아군을 식별할 수 있으며, 이는 조직 내 세포 이질성을 이해하고 새로운 세포 유형을 발견하는 데 중요합니다.
NMF는 비음수 성분만을 생성하기 때문에 유전자 발현 데이터 처리에 특히 유용합니다. 유전자 발현 데이터는 본질적으로 비음수이기 때문입니다. 또한, NMF의 또 다른 장점은 그 결과가 쉽게 해석된다는 점입니다. 유전자 집합은 세포 발현 프로필을 구성하는 기본 빌딩 블록으로 볼 수 있습니다.
백태파크 생명공학 - 생명제품특성화, 멀티오믹스 생물질량분석 고품질 서비스 제공업체
관련 서비스:
How to order?