[R] how to use "tidytext" package in text mining.
"tidytext" package에 대해 알아보고 사용해 보려 합니다. 정돈 텍스트 형식이라고도 불리는데, 특징은 1개 행마다 1개의 토큰이 있게 데이터를 구성하는 겁니다. (1행당 1토큰) 정돈 텍스트 형식의 장점은 gplot2나 dplyr을 활용하여 텍스트를 요약, 시각화를 효율적으로 할 수 있습니다. 기본적인 사용법은 아래와 같습니다. 1. text를 dplyr패키지를 사용해 변환 2. tidytext의 unnest_tokens를 이용해 1행 1토큰으로 변환 github 링크 : https://github.com/jasonlee8318/R-programming/blob/master/tidytext_1.R 참고하기 좋은 사이트 : https://junhewk.github.io/text/2017/06/..
R programming
2020. 2. 25. 13:53
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- s3
- 자기계발
- 기술사학원
- 12207
- 로블록스
- r
- 131회정보관리기술사
- FLASK
- gpt3.5
- 정보관리기술사합격
- 밀키트요리
- 정보관리
- lambda
- 기술사
- pytorch
- AWS
- 정보관리기술사
- 밀키트
- 머신러닝
- 인조기프
- IIS
- 콘도챗봇
- ISO 12207
- 챗봇
- wfastcgi
- iso12207
- 정보관리기술사독학
- hackerrank
- 추천도서
- 추천시스템
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
글 보관함