단백질 다중 서열 정렬 결과 분석하는 방법
단백질 다중 서열 정렬(Multiple Sequence Alignment, MSA)은 세 개 이상의 단백질 서열을 배열하여 최대한 유사성과 차이점을 식별하는 기술입니다. 단백질 다중 서열 정렬 결과를 분석하면 단백질 가족 구성원 간의 진화적 관계, 도메인, 기능적 위치 및 기타 생물학적으로 중요한 정보를 밝혀낼 수 있습니다.

그림 1. 단백질 다중 서열 정렬
MSA 결과를 분석하는 것은 여러 단계로 이루어지며, 정렬 품질 평가, 보존성 분석, 진화적 관계 추론 및 기능적 위치 예측 등을 포함합니다.
1. 정렬 품질 평가
- 정렬의 일관성 검사: 대량의 삽입 또는 삭제 영역이 존재하는지, 그리고 다른 서열과 현저하게 다른 단백질 서열이 있는지 관찰합니다. 이러한 요소는 정렬 품질이 낮다는 신호일 수 있습니다.
- 스코어링 시스템 사용: SP-score와 같은 정렬 품질 평가 도구를 사용하여 정렬의 전체 품질을 정량적으로 평가합니다.
- 시각화 도구: Jalview, MAFFT와 같은 시각적 인터페이스를 사용하여 정렬의 정확성과 일관성을 직관적으로 검사합니다.
2. 보존성 분석:
- 보존된 영역 식별: 여러 서열에서 고도로 보존된 아미노산 잔기를 찾아냅니다. 이러한 영역은 일반적으로 단백질의 기능과 밀접하게 관련되어 있습니다.
- 보존성 점수 계산: Consurf와 같은 도구를 사용하여 진화 과정에서 아미노산의 변화 빈도에 따라 각 위치의 보존성을 점수화합니다.
- 보존성 지도: 각 위치의 보존성을 직관적으로 보여주는 보존성 지도를 생성하여 기능적 도메인이나 활성 부위를 예측합니다.

그림 2. 단백질다중 서열 정렬의 서열 마크 표현
3. 진화적 관계 추론
- 계통발생 나무 구성: MSA 결과를 사용하여 계통발생 나무를 구성하고 서로 다른 단백질 서열 간의 진화적 관계를 추론합니다.
- 진화적 가지 분석: 계통발생 나무의 가지 구조를 분석하여 단백질 가족의 진화 역사 및 기능적 분화를 추정할 수 있습니다.
- 상동 서열 식별: 정렬 및 계통발생 분석을 통해 알려진 기능성 단백질과 유사한 서열을 식별하고 그 잠재적 기능을 추정합니다.
4. 기능적 위치 예측
- 핵심 위치 식별: 보존성 분석을 기반으로 잠재적인 기능적 위치나 활성 중심을 식별합니다.
- 구조 예측: 가능하다면 단백질의 3차원 구조 정보를 결합하여 예측된 기능적 위치의 정확성을 추가로 검증합니다.
- 문헌 검증: 분석 결과를 이미 발표된 연구 결과와 비교하여 예측된 기능적 위치나 도메인의 관련성을 검증합니다.
위의 단계들을 통해 다중 서열 정렬 결과에서 가치 있는 생물학적 정보를 추출하여 단백질 기능 연구 및 진화 분석에 중요한 단서를 제공합니다.
BiotechPack, 바이오의약품 특성 분석 및 멀티오믹스 질량분석(MS) 서비스 제공업체
관련 서비스:
문의 제출
이름 *
이메일 주소 *
전화번호
문의 프로젝트 *
프로젝트 설명*
How to order?






