제가 보낸 전사체 분석에서 NCBI에서 선택한 첫 번째 참조 유전체의 라틴명은 같지만, 정렬율이 60%에 불과한데 이렇게 사용해도 될까요? 아니면 비참조를 선택하는 것이 좋을까요?
전사체 분석에서 적절한 참조 게놈을 선택하는 것은 결과의 신뢰성과 생물학적 의미에 매우 중요합니다. 매핑 비율이 60%에 불과하다면 다음과 같은 문제가 있을 수 있습니다.
1. 매핑 비율이 낮은 가능성 있는 원인
1. 참조 게놈의 불완전성 또는 버전 불일치
(1) 선택한 참조 게놈이 오래되어 샘플 종의 모든 유전자 서열을 포함하지 않을 수 있습니다.
(2) 종의 최신 참조 게놈 버전이나 업데이트된 주석 파일이 있는지 확인하십시오.
2. 종의 차이
(1) 샘플이 참조 게놈과 같은 속 또는 종에 속하더라도 아종, 지리적 집단 또는 유전적 배경의 차이가 클 경우 낮은 매핑 비율로 이어질 수 있습니다.
(2) 전사체 샘플에는 특정 집단의 변이 유전자가 포함될 수 있으며, 참조 게놈에서 잘 반영하지 못할 수 있습니다.
3. 샘플 품질이나 처리 문제
(1) 전사체 샘플에 오염된 서열(예: 박테리아나 다른 종의 RNA)이 포함될 수 있어 유효 매핑 비율이 감소할 수 있습니다.
(2) 샘플 처리 과정(예: 어댑터 오염, 저품질 리드)은 매핑 효과를 감소시킬 수 있습니다.
4. 기술적 요인
(1) 매핑 도구의 매개변수 설정(예: 불일치 허용 값)이 충분히 유연하지 않을 수 있습니다.
(2) RNA 시퀀싱 리드의 길이나 품질 분포가 매핑 도구의 최적 조건에 부합하는지 여부.
2. 낮은 매핑 비율의 영향
낮은 매핑 비율은 다음과 같은 영향을 미칠 수 있습니다.
1. 표현 정량의 부정확성: 다수의 리드가 성공적으로 매핑되지 않으면 특정 유전자 발현량이 과소평가될 수 있습니다.
2. 기능 주석 부족: 참조 게놈에 매핑되지 않은 영역에서 중요한 기능성 유전자가 손실될 수 있습니다.
3. 후속 분석의 편향: 차등 발현 분석이나 GO/KEGG 풍부도 분석 결과가 왜곡될 수 있습니다.
3. 비참조 분석의 적합성 선택
1. 비참조 분석(de novo assembly)은 다음과 같은 경우에 적합합니다.
(1) 적절한 참조 게놈이 없는 경우: 예를 들어 대상 종이 비모델 생물체일 때.
(2) 원거리 종의 매핑 비율이 낮을 때: 참조 게놈의 매칭도가 부족할 때(예: <70%).
(3) 연구 목표가 새로운 유전자나 특정 변이를 포함할 때: 샘플에서 참조 게놈에 주석되지 않은 새로운 전사체나 유전자 변이를 분석할 때.
2. 비참조 분석의 장점은 참조 게놈에 독립적이며, 샘플 내 새로운 서열을 발견할 수 있지만 다음과 같은 도전 과제가 있습니다.
(1) 높은 계산 자원 요구: 조립 및 주석 작업에 상당한 계산 자원이 필요합니다.
(2) 신뢰성 낮음: 조립 품질(예: 컨티그의 완전성 및 정확성)이 참조 기반 분석보다 낮을 수 있습니다.
(3) 공공 데이터베이스에 의존한 주석: 기능 주석에 대한 의존성으로 정보가 충분히 포괄적이지 않을 수 있습니다.
4. 최적화 전략 제안
1. 더 나은 참조 게놈 시도
(1) 종에 대한 최신 참조 게놈 버전이 있는지 확인하십시오.
(2) 종의 아종 차이가 크면 샘플에 더 가까운 아종 참조 게놈을 사용해 보십시오.
(3) 혼합 참조 게놈 고려: 샘플이 여러 참조 종과 유사하다면, 결합 참조 게놈을 구축할 수 있습니다.
2. 매핑 프로세스 최적화
(1) 매핑 도구 매개변수 최적화
-
매핑 도구(HISAT2, STAR 등)의 불일치 허용 값과 갭 패널티를 조정하십시오.
-
다양성이 높은 경우에 적합한 도구(Subread 등)를 사용하십시오.
(2) 품질 관리
-
원시 리드의 품질 분포가 양호한지 확인하고 어댑터 및 저품질 서열을 제거하십시오.
-
비대상 종 오염이 있는지 확인하십시오.
3. 혼합 전략 수행
(1) 참조 기반 매핑과 비참조 조립을 동시에 수행하고 결과를 통합하십시오.
(2) StringTie 또는 Trinity와 같은 도구를 통해 de novo 조립 결과와 참조 게놈을 결합하여 주석 비율을 높일 수 있습니다.
4. 비참조 분석 주의 사항
(1) 적절한 참조 게놈을 찾을 수 없는 경우, 비참조 분석을 시도하고 공공 데이터베이스(NR, SwissProt, Pfam 등)를 사용하여 기능 주석을 수행하십시오.
(2) 후속으로 BUSCO를 통해 비참조 조립의 완전성을 평가하여 신뢰성을 확보하십시오.
5. 의사결정 제안
1. 매핑 비율이 지속적으로 70% 이하이고 개선할 수 없는 경우: 비참조 분석 또는 혼합 전략을 선택하는 것이 좋습니다.
2. 참조 게놈이나 매핑 매개변수를 최적화할 수 있는 경우: 참조 기반 매핑 프로세스의 개선을 우선적으로 시도하십시오. 이는 기능 주석 및 후속 분석에 더 큰 이점을 제공합니다.
Biotech Parker 생명공학 – 생물제제 특성화, 다중체 생물 질량 분석 우수 서비스 제공업체
관련 서비스:
How to order?






