자카드 유사도란?
: Jaccard Similarity 혹은 자카드 지수라고 불리며, 두 문장을 각각 단어의 집합으로 만든 뒤 두 집합을 통해 유사도를 측정하는 방식 중 하나다.
(정의) 교집합의 크기 / 합집합의 크기
- 0과 1 사이의 값을 가진다.
- 만약 두 집합이 동일하다면 1의 값을 가진다.
- 만약 두 집합의 교집합이 없다면 0의 값을 가진다.
자바로 만든 자카드 유사도 >> jihyeong-ji99hy99.tistory.com/148
'Computer Science > 알고리즘' 카테고리의 다른 글
그래프 탐색(2) - BFS(너비우선탐색) 알고리즘 (0) | 2021.01.20 |
---|---|
그래프 탐색(1) - DFS(깊이 우선 탐색) 알고리즘 (0) | 2021.01.19 |
[알고리즘] Dynamic 프로그래밍과 예제들 (0) | 2020.05.13 |
[알고리즘] D&C 기법의 예시와 좋은 pivot이란? (0) | 2020.05.11 |
[알고리즘] D&C 기법, Recursion tree와 Master Theorem (0) | 2020.05.08 |
댓글