[1차] 뉴스 클러스터링
문제이해 입력으로 들어온 str1, str2를 두글자씩 끊어 다중집합의 원소로 만든다. 예제 1 FRANCE , french 가 있으면 FRANCE = {fr, ra, an, nc, ce} french = {fr, re, en, nc, ch} A U B = {fr, ra, an, nc, ce, re, en,ch} A X B = {fr, nc} n( A U B) = 8 n( A X B) = 2 유사도 = 0.25 65536 * 0.25 = 16384 예제 2 aa1+aa2 AAAA12 aa1+aa2 = { aa, aa } AAAA12 = {aa, aa, aa} n( A U B) = {aa, aa, aa} n( A X B) = {aa, aa} 유사도 = 0.6666 65536 * 2/3 = 43690.666..