본문 바로가기
Computer Science/알고리즘

자카드 유사도란?

by 그적 2020. 12. 27.

자카드 유사도란?

: Jaccard Similarity 혹은 자카드 지수라고 불리며, 두 문장을 각각 단어의 집합으로 만든 뒤 두 집합을 통해 유사도를 측정하는 방식 중 하나다.

 

(정의) 교집합의 크기 / 합집합의 크기

 

- 0과 1 사이의 값을 가진다.

- 만약 두 집합이 동일하다면 1의 값을 가진다.

- 만약 두 집합의 교집합이 없다면 0의 값을 가진다.

 

자바로 만든 자카드 유사도 >> jihyeong-ji99hy99.tistory.com/148

 

댓글