안녕하세요. 은행 IT운영부 이지성과장입니다. 오늘은 토픽모델링에 대해서 알아보려 합니다. 토픽모델링 (topic modeling)이란 대량의 텍스트로 이루어진 어떤 문서에서 주제를 컴퓨터가 스스로 알아내는 것입니다. 토픽모델링을 통해서 대량의 문서가 어떤 주제로 이야기를 하고 있는지 요약할 수 있습니다. 신문기사, 논문, 상품평 등등 텍스트로 이루어진 데이터 입력하면 해당 주제를 출력하는 것입니다. 토픽모델링 기법 중에서 대표적인 기법인 "LDA"에 대해서 조금더 말씀드리면... LDA (잠재 디리클레 할당이라고도 합니다) 는 확률적 생성모형(Generative model)을 가정합니다. 간단히 말씀드리면, 문서에서 많이 등장하는 단어가 그 문서의 주제가 될 가능성이 크다는 것입니다. 위 이미지는 LD..
NLP
2020. 5. 13. 09:59
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- IIS
- 챗봇
- 추천도서
- wfastcgi
- 정보관리
- 자기계발
- 정보관리기술사독학
- r
- FLASK
- 추천시스템
- 로블록스
- 콘도챗봇
- 밀키트요리
- hackerrank
- ISO 12207
- 정보관리기술사합격
- 12207
- gpt3.5
- 기술사학원
- 인조기프
- 머신러닝
- AWS
- 131회정보관리기술사
- 기술사
- iso12207
- 정보관리기술사
- pytorch
- s3
- 밀키트
- lambda
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
글 보관함