개발/AI 정리

bag of words

개복치 개발자 2020. 8. 3. 20:14

- 허민석님의 강의를 참고하였습니다. 링크는 맨 아래에

 

bag of words 가 뭔지 알아보고 가겠습니다.

 

간단하게 bag 안에 단어들이 들어 있고, 이 단어들을 이용해서 문장의 유사도를 구하는 방식입니다.

 

아래와 같은 단어들이 있을 때

 

이 친구들을 아래와 같이 벡터 형태로 표현합니다.

 

이 것들을 이용해서 문장들간의 유사도를 추출해낼 수 있습니다.

 

 

구현

 

 

 

 

 

 

 

참고

[1] - https://www.youtube.com/watch?v=dKYFfUtij_U

[2] - https://wikidocs.net/22650

 

'개발 > AI 정리' 카테고리의 다른 글

NLTK 사용법  (0) 2020.07.29
엔드로피란  (0) 2020.07.28
TF-IDF  (0) 2020.07.27
LSA 잠재의미분석  (0) 2020.07.27
bag of words  (0) 2020.07.27