안녕하세요. 은행IT운영부 이지성과장입니다. 오늘은 자연어 처리 기법 중 하나인 TF-IDF, 단어-역문서 빈도라고도 하는데요. 바로 이 TF-IDF 에 대해서 알아보도록 하겠습니다. TF-IDF의 약자와 설명은 아래와 같습니다. 1. TF : Term Frequencey , 단어빈도 - 특정 문서에서 나타나는 특정 단어의 총 횟수입니다. 2. IDF : Inverse Document Frequency , 역문서 빈도 - TF와 반대되는 개념으로 특정 단어가 나타나는 문서의 수 입니다. 이렇게 설명만 보면 이해가 잘 안되시죠?? ㅜㅜ 그래서 더 알기 쉽게 설명 들어갑니다. 아래와 같이 4개의 문서가 있다고 가정해 보겠습니다. 문서1: i love a dog. 문서2: i love a cat not a d..
NLP
2020. 8. 21. 13:46
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- 로블록스
- s3
- 기술사학원
- 추천도서
- AWS
- 정보관리
- 12207
- pytorch
- 밀키트요리
- 인조기프
- r
- 기술사
- 챗봇
- hackerrank
- gpt3.5
- 머신러닝
- 정보관리기술사독학
- IIS
- 콘도챗봇
- iso12207
- 131회정보관리기술사
- ISO 12207
- 추천시스템
- lambda
- 정보관리기술사
- wfastcgi
- 정보관리기술사합격
- 밀키트
- 자기계발
- FLASK
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
글 보관함