email

이메일:

info@biotech-pack.com

百泰派克蛋白质测序
百泰派克蛋白质组学服务
百泰派克生物制药分析服务
百泰派克代谢组学服务

부하도(biplot)를 어떻게 분석하나요?

적재도(Biplot)는 주성분 분석(PCA) 결과를 결합한 2차원 또는 3차원 그래픽 도구로, 샘플(점)의 분포와 변수(적재 벡터)의 기여도를 모두 보여줍니다. 적재도를 분석할 때 주로 다음 사항에 주의해야 합니다.

 

1. 적재도의 기본 구성 이해하기

1. 적재도는 주성분(Principal Components, PCs)으로 구성되며, 일반적으로 2차원(PC1 및 PC2)으로, 이 두 성분이 데이터의 대부분의 변이를 설명할 수 있습니다.

2. 그래프의 점은 샘플(observations)을 나타내고, 화살표나 벡터는 변수(variables)를 나타냅니다. 샘플 점의 분포는 샘플 간의 유사성을 반영하며, 변수 벡터의 방향과 길이는 주성분에 대한 변수의 기여도를 나타냅니다.

 

2. 변수 벡터 해석하기

1. 벡터의 길이: 벡터가 길수록 해당 변수가 주성분에 더 많이 기여함을 나타냅니다. PCA에서 벡터의 길이는 선택한 주성분에서 해당 변수의 분산 기여도를 반영합니다.

2. 벡터의 방향: 서로 비슷한 방향의 벡터는 변수들 간에 양의 상관관계가 있음을 나타내며, 반대 방향의 벡터는 음의 상관관계를 나타냅니다. 수직 방향의 벡터는 변수 간의 상관관계가 낮거나 없음을 의미합니다.

 

3. 샘플 점의 위치

1. 샘플 점의 위치는 주성분 공간에서 변수의 선형 조합으로 투영되어 얻어지며, 가까운 샘플 점은 주성분 공간에서의 유사성이 높음을 나타내며, 즉 변수 측정값이 비슷함을 의미합니다.

2. 샘플 점과 변수 벡터 간의 거리와 각도는 해당 변수에서 샘플의 성과를 설명할 수 있습니다. 예를 들어, 특정 샘플 점이 특정 변수의 화살표에 가까우면 해당 샘플이 해당 변수에서 높은 점수를 가졌음을 의미합니다.

 

4. 주성분의 설명력 분석하기

1. 그래프에서 PC1 및 PC2의 설명 비율을 확인합니다. 일반적으로 적재도의 축에 표시됩니다. PC1 및 PC2의 설명력 합계가 높을수록 두 주성분이 원래 데이터의 변이를 더 잘 반영함을 나타냅니다.

2. PC1 및 PC2의 설명력이 낮으면(예: 50% 미만), 다른 주성분을 추가로 확인하거나 데이터가 PCA 분석에 적합한지 다시 고려해야 할 수도 있습니다.

 

5. 변수와 샘플의 관계

1. 특정 변수 벡터의 방향으로 샘플 점이 집중되어 있으면, 해당 변수에서 높은 점수를 가진 샘플을 식별할 수 있으며, 특정 변수에서 두드러진 성과를 보이는 샘플을 찾아낼 수 있습니다.

2. 다양한 주성분에서 샘플 점의 분포를 관찰하여 샘플이 다변량 데이터 세트에서 주요 변이의 출처를 파악할 수 있습니다. 예를 들어, 특정 변수에서 두드러진 성과를 보이는 샘플을 찾아내어 보다 구체적인 연구를 진행할 수 있습니다.

 

6. 다중 성분의 해석

1. 샘플이 특정 요인(예: 실험 처리, 다른 그룹 등)으로 분류된 경우, 적재도에서 다른 그룹의 샘플을 표시하여 샘플 간의 차이를 추가 분석할 수 있습니다.

2. 실험 설계를 결합하여 주성분이 샘플 그룹을 구분할 수 있는지 설명하고, 이러한 변수가 그룹 간 차이에 어떤 영향을 미치는지 추론할 수 있습니다.

 

다음은 Biplot을 분석하는 간단한 예로, 보다 직관적으로 이해하는 데 도움을 줍니다.

案例.jpg

1. 주성분 설명

  • PC1은 데이터 분산의 60%를 설명하고, PC2는 25%를 설명합니다. 총 85%의 분산이 두 주성분에 의해 포착되었습니다.

 

2. 샘플 분포

과일 샘플이 2차원 공간에 분포합니다. 예를 들어:

  • 사과와 오렌지는 그래프의 오른쪽 상단에 가깝게 위치하여, 이들의 특성이 유사함을 나타냅니다.
  • 바나나는 그래프의 왼쪽 하단에 위치하여 다른 샘플과 큰 차이를 보이며, 이는 바나나의 특성이 이 두 주성분에서 다른 과일과 다름을 나타냅니다.

 

3. 변수의 적재 벡터

  • 무게(Weight): 화살표가 오른쪽 상단을 가리키며, 길이가 길어 '무게'가 PC1에 크게 기여하고, PC1과 양의 상관관계가 있음을 나타냅니다. 오른쪽 상단에 가까운 샘플은 무게가 큰 샘플로, 예를 들어 사과와 오렌지입니다.
  • 당도(Sugar Content): 화살표가 오른쪽을 가리키며, 길이가 길어 '당도'가 PC1에 크게 기여하고, 당도와 무게 간에 일정한 양의 상관관계가 있음을 나타냅니다.
  • 산도(Acidity): 화살표가 왼쪽 하단을 가리키며, 길이가 길어 '산도'가 PC2에 크게 기여하고, 산도와 무게가 음의 상관관계를 가짐을 나타냅니다. 바나나 샘플은 이 화살표에 가까워 바나나의 산도가 높음을 나타냅니다.
  • 색상 밝기(Color Brightness): 화살표가 오른쪽 하단을 가리키며, 길이가 짧아 색상 밝기가 PC1과 PC2에 대한 기여도가 적고, 다른 변수와 거의 상관관계가 없음을 나타냅니다.

 

4. 변수 간의 관계

  • 무게와 당도: 이 두 변수의 화살표가 거의 평행하여, 이들이 높은 양의 상관관계를 가짐을 나타냅니다. 즉, 무게가 큰 과일은 일반적으로 당도도 높습니다.
  • 무게와 산도: 무게의 화살표와 산도의 화살표가 반대 방향을 가리켜, 무게와 산도가 음의 상관관계를 가짐을 나타냅니다. 즉, 무게가 큰 과일은 산도가 낮습니다.

 

5. 샘플과 변수의 관계

  • 사과와 오렌지는 '무게'와 '당도'의 화살표에 가까워 그들이 비교적 무겁고 당도가 높음을 나타냅니다.
  • 바나나는 '산도'의 화살표에 가까워 바나나의 산도가 높음을 나타냅니다.
  • 색상 밝기의 화살표가 짧아 과일의 구분에 대한 기여도가 적음을 나타내며, 아마도 샘플 차이를 결정하는 주요 요소가 아닐 수 있습니다.

 

이 그래프를 통해 다양한 과일이 물리적 및 화학적 특성에서 어떻게 분포하는지와 변수 간의 관계를 확인할 수 있습니다. 예를 들어, '무게'와 '당도'의 양의 상관관계와 '산도'와 '무게'의 음의 상관관계를 볼 수 있습니다.

 

BiotechPack, 바이오의약품 특성 분석 및 멀티오믹스 질량분석(MS) 서비스 제공업체

 

관련 서비스:

주성분 분석(PCA)

 

문의 제출
이름 *
이메일 주소 *
전화번호
문의 프로젝트
프로젝트 설명*

 

How to order?