중화사전망 - 구한말 사전 - tSNE와 UMAP의 차이점

tSNE와 UMAP의 차이점

이 기사는 내 연구 노트입니다. 먼저 연구 링크를 첨부하세요: /s/qkbc1vz-ERHzGp8gfLiVsg

우선, 이것은 scRNA-seq의 2차원 축소입니다.

그렇다면 이들의 차이점은 무엇입니까?

우선 고차원 공간에서는 두 점(두 개의 셀) 사이의 거리가 다르다고 기술된다. tSNE는 두 점 사이의 거리를 확률로 변환하는 '확률적 알고리즘'을 채택하고 있다. , 두 지점 i와 j 사이의 거리가 상대적으로 가까우면 해당 확률이 더 커지는 반면 UMAP는 전통적인 유클리드 거리를 채택합니다.

여기서 x는 고차원 공간에서의 거리를 나타냅니다

σ를 계산할 때(거리 계산에 필요)

그 전에 간단히 소개하자면 다음은, Perplexity와 Shannon 엔트로피

Perplexity는 인접한 셀의 수를 반영합니다. Perplexity가 클수록 셀은 더 조밀하게 분포됩니다. 일반적으로 perplexity = (셀 수 - 1) / 3

섀넌 엔트로피는 세포의 혼돈 정도를 설명하는 데 사용되는 물리량입니다.

두 셀 사이에는 일정한 거리가 있습니다. 섀넌 엔트로피는 셀 사이의 거리가 고르지 않은 정도를 나타냅니다.

다시 그림으로 돌아가겠습니다.

p>

마지막으로 차원 축소 후 저차원 공간에서의 거리 보정 방법은 다릅니다. tSNE는 t 분포를 사용하여 보정하는 반면, UMAP는 최소 거리와의 비교를 사용하여 표현식을 결정합니다.

여기서 y는

고차원 공간의 거리를 저차원 공간에 매핑하면 저차원 거리를 시각화할 수 있습니다.