- 허민석님의 강의를 참고하였습니다. 링크는 맨 아래에
bag of words 가 뭔지 알아보고 가겠습니다.
간단하게 bag 안에 단어들이 들어 있고, 이 단어들을 이용해서 문장의 유사도를 구하는 방식입니다.
아래와 같은 단어들이 있을 때
이 친구들을 아래와 같이 벡터 형태로 표현합니다.
이 것들을 이용해서 문장들간의 유사도를 추출해낼 수 있습니다.
구현
참고
[1] - https://www.youtube.com/watch?v=dKYFfUtij_U
[2] - https://wikidocs.net/22650
'개발 > AI 정리' 카테고리의 다른 글
NLTK 사용법 (0) | 2020.07.29 |
---|---|
엔드로피란 (0) | 2020.07.28 |
TF-IDF (0) | 2020.07.27 |
LSA 잠재의미분석 (0) | 2020.07.27 |
bag of words (0) | 2020.07.27 |