[R] how to use "tidytext" package in text mining.
"tidytext" package에 대해 알아보고 사용해 보려 합니다. 정돈 텍스트 형식이라고도 불리는데, 특징은 1개 행마다 1개의 토큰이 있게 데이터를 구성하는 겁니다. (1행당 1토큰) 정돈 텍스트 형식의 장점은 gplot2나 dplyr을 활용하여 텍스트를 요약, 시각화를 효율적으로 할 수 있습니다. 기본적인 사용법은 아래와 같습니다. 1. text를 dplyr패키지를 사용해 변환 2. tidytext의 unnest_tokens를 이용해 1행 1토큰으로 변환 github 링크 : https://github.com/jasonlee8318/R-programming/blob/master/tidytext_1.R 참고하기 좋은 사이트 : https://junhewk.github.io/text/2017/06/..
R programming
2020. 2. 25. 13:53
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- FLASK
- 로블록스
- 131회정보관리기술사
- iso12207
- 자기계발
- 밀키트요리
- wfastcgi
- 추천시스템
- gpt3.5
- 기술사학원
- 정보관리기술사합격
- s3
- 밀키트
- AWS
- 정보관리기술사
- 머신러닝
- 챗봇
- hackerrank
- 인조기프
- 12207
- IIS
- lambda
- 추천도서
- pytorch
- 정보관리기술사독학
- ISO 12207
- 정보관리
- 콘도챗봇
- r
- 기술사
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
글 보관함