코사인 유사도와 텍스트 마이닝에 대해서 알아보겠습니다.
이 빌어먹을 벡터를 고등학교 때 배웠는데 이나먹고 다시 볼 줄은 몰랐네요
자 정말정말 간단하게 처리하면
문서의 유사도에 대해서 알고 싶은 것인데, 이 문서(문장)을 벡터화 시켜서 문장간의 유사도를 비교해보는 방법입니다.
얘를 그림과 수식으로 나타내면
위와 같이 만들어 낼 수 있습니다.
실제 상황에서 적용을 한다고 하면
아래와 같이 적용해 볼 수 있습니다
참조
'개발 > AI 정리' 카테고리의 다른 글
LSA 잠재의미분석 (0) | 2020.07.27 |
---|---|
bag of words (0) | 2020.07.27 |
MNIST (0) | 2020.02.17 |
Tensorflow lite (0) | 2020.02.16 |
Random Forest (0) | 2020.02.12 |