개발/AI 정리

코사인 유사도 Cosine Similarity

개복치 개발자 2020. 7. 27. 15:21

코사인 유사도와 텍스트 마이닝에 대해서 알아보겠습니다.

 

이 빌어먹을 벡터를 고등학교 때 배웠는데 이나먹고 다시 볼 줄은 몰랐네요

 

자 정말정말 간단하게 처리하면

 

문서의 유사도에 대해서 알고 싶은 것인데, 이 문서(문장)을 벡터화 시켜서 문장간의 유사도를 비교해보는 방법입니다.

 

얘를 그림과 수식으로 나타내면

 

 

위와 같이 만들어 낼 수 있습니다.

 

실제 상황에서 적용을 한다고 하면

 

아래와 같이 적용해 볼 수 있습니다

 

 

 

 

 

 

 

참조

 

[1] - https://wikidocs.net/24603

'개발 > AI 정리' 카테고리의 다른 글

LSA 잠재의미분석  (0) 2020.07.27
bag of words  (0) 2020.07.27
MNIST  (0) 2020.02.17
Tensorflow lite  (0) 2020.02.16
Random Forest  (0) 2020.02.12