email

이메일:

info@biotech-pack.com

百泰派克蛋白质测序
百泰派克蛋白质组学服务
百泰派克生物制药分析服务
百泰派克代谢组学服务

단일 세포 시퀀싱 데이터를 신청했습니다. 각 샘플의 fastq 데이터에는 L001-L004의 네 개의 fastq 데이터가 포함되어 있습니다. 어떻게 처리해야 하나요?

단일 세포 시퀀싱 데이터는 일반적으로 단일 세포 RNA 시퀀싱(scRNA-seq), 단일 세포 DNA 시퀀싱(scDNA-seq), 단일 세포 ATAC 시퀀싱(scATAC-seq)을 포함합니다. 서로 다른 유형의 단일 세포 시퀀싱에 대해 서로 다른 다운스트림 분석 절차가 있습니다. 단일 세포 시퀀싱 데이터를 처리할 때 각 샘플의 FASTQ 데이터가 L001, L002, L003, L004의 네 가지 파일을 포함하는 경우, 이는 일반적으로 시퀀싱 플랫폼(Illumina 등)이 페어드 엔드(paired-end) 시퀀싱 전략을 사용하고 각 샘플이 여러 레인(lane)을 포함할 수 있기 때문입니다. 다음은 이러한 상황에 대한 처리 단계입니다.

 

1. 파일 명명 규칙 이해하기

1. L001-L004: 서로 다른 시퀀싱 레인을 나타내며, 일반적으로 Illumina 플랫폼은 서로 다른 레인에서 병렬 시퀀싱을 수행합니다.

2. 각 샘플은 여러 레인의 출력 데이터를 가질 수 있으며, 각 레인의 FASTQ 파일은 두 개의 파일 쌍으로 나뉩니다: 하나는 R1(정방향 읽기)이며, 다른 하나는 R2(역방향 읽기)로, 이는 페어드 엔드 시퀀싱의 두 부분에 각각 대응합니다.

3. 일반적으로 L001, L002, L003, L004는 다른 시퀀싱 레인을 나타내며, 이는 각 샘플이 다음과 같은 4개의 파일을 생성할 수 있음을 의미합니다.

(1) L001_R1.fastq와 L001_R2.fastq

(2) L002_R1.fastq와 L002_R2.fastq

(3) L003_R1.fastq와 L003_R2.fastq

(4) L004_R1.fastq와 L004_R2.fastq

 

2. 일반 프로세스

1. L001-L004 데이터 병합: 샘플이 여러 레인에서 온 경우(예: L001부터 L004까지) 각 샘플의 시퀀싱 데이터를 일관되게 분석하기 위해 일반적으로 각 레인의 R1과 R2 파일을 하나의 큰 파일 쌍으로 병합합니다. 이러한 파일을 병합하는 데 Linux 시스템에서 cat과 같은 도구를 사용할 수 있습니다.

 

2. 품질 관리(QC): 여러 레인의 데이터를 병합한 후, 품질 관리(QC)는 중요한 단계입니다. FastQC를 사용하여 FASTQ 파일의 품질을 확인하여 시퀀싱 데이터의 품질이 각 레인에서 큰 차이가 없는지 확인할 수 있습니다. FastQC는 각 레인에 대해 품질 보고서를 생성하며, 특정 레인에 유의한 문제가 있는 경우 해당 레인의 데이터를 제거하거나 다른 처리를 수행할 수 있습니다.

 

3. 저품질 시퀀스 제거(선택 사항): FastQC 보고서에 짧은 읽기 길이 또는 높은 오류율과 같은 저품질 시퀀스가 표시되는 경우 Trimmomatic, Cutadapt와 같은 도구를 사용하여 이러한 저품질 시퀀스를 자르고 제거할 수 있습니다.

 

4. 어댑터 시퀀스 제거: 단일 세포 시퀀싱 데이터는 일반적으로 짧은 읽기 길이 시퀀싱에서 어댑터 시퀀스(adapter sequences)를 포함하며, Cutadapt 또는 TrimGalore와 같은 도구를 사용하여 이러한 어댑터 시퀀스를 제거할 수 있습니다. 어댑터 제거는 특히 특정 프라이머를 사용할 때 일반적인 사전 처리 단계입니다.

 

5. 정렬: 데이터 유형에 적합한 정렬 도구를 사용합니다(STAR, bwa 등).

 

6. 정량화: 발현 또는 변이 매트릭스 생성.

 

7. 다운스트림 분석: 데이터 유형에 따라 적절한 생물 정보학 도구를 사용하여 분석합니다.

 

3. 데이터 유형에 따른 후속 분석

1. 단일 세포 RNA 시퀀싱(scRNA-seq)

(1) 일반적인 도구: CellRanger(10x Genomics 플랫폼 데이터), Seurat(R 패키지), Scanpy(Python 패키지)

(2) 프로세스 개요:

  • CellRanger를 사용하여 품질 관리, 정렬 및 정량화를 수행하여 유전자 발현 매트릭스(Gene Expression Matrix)를 생성합니다.
  • Seurat 또는 Scanpy를 사용하여 차원 축소, 클러스터링 및 세포 유형 주석을 수행합니다.

 

2. 단일 세포 DNA 시퀀싱(scDNA-seq)

(1) 일반적인 도구: CellRanger-DNA, GATK, CNVkit

(2) 프로세스 개요:

  • CellRanger-DNA를 사용하여 품질 관리, 정렬 및 변이 검출을 수행합니다.
  • 단일 세포 복제 수 변이(CNV) 분석 및 체세포 돌연변이 검출을 수행합니다.

 

3. 단일 세포 ATAC 시퀀싱(scATAC-seq)

(1) 일반적인 도구: CellRanger-ATAC, ArchR, Signac

(2) 프로세스 개요:

  • CellRanger-ATAC을 사용하여 품질 관리 및 정렬을 수행하여 접근성 피크 매트릭스를 생성합니다.
  • ArchR 또는 Signac을 사용하여 다운스트림 접근성 패턴 분석을 수행합니다.

 

백타이파크 생명공학 - 생물제제 특성화, 다중 오믹스 생물질량분석 우수 서비스 제공업체

 

관련 서비스:

단일 세포 시퀀싱

문의 제출
이름 *
이메일 주소 *
전화번호
문의 프로젝트 *
프로젝트 설명*

 

How to order?