"tidytext" package에 대해 알아보고 사용해 보려 합니다. 정돈 텍스트 형식이라고도 불리는데, 특징은 1개 행마다 1개의 토큰이 있게 데이터를 구성하는 겁니다. (1행당 1토큰) 정돈 텍스트 형식의 장점은 gplot2나 dplyr을 활용하여 텍스트를 요약, 시각화를 효율적으로 할 수 있습니다. 기본적인 사용법은 아래와 같습니다. 1. text를 dplyr패키지를 사용해 변환 2. tidytext의 unnest_tokens를 이용해 1행 1토큰으로 변환 github 링크 : https://github.com/jasonlee8318/R-programming/blob/master/tidytext_1.R 참고하기 좋은 사이트 : https://junhewk.github.io/text/2017/06/..
apply 계열 함수 -apply apply 함수는 행렬이나 데이터프레임을 받아들여 열이나 행에 대하여 특정 함수를 적용시킬 때 사용 사용법: apply(X, MARGIN, FUN) 이 때, X는 data, Margin 1 : row / 2 : column , Fun : 적용함수 (mean, sum등) apply(iris[,1:4], 2, mean) Sepal.Length Sepal.Width Petal.Length Petal.Width 5.843333 3.057333 3.758000 1.199333 -lapply 데이터프레임이나 리스트를 받아들여 데이터 프레임의 경우 열에 대하여 특정 함수를 적용시키는 함수, 출력은 리스트로 반환 사용법 : lapply(X, FUN) X는 data, Fun: 적용함수 ..
- Total
- Today
- Yesterday
- FLASK
- r
- 정보관리기술사독학
- 머신러닝
- 챗봇
- 로블록스
- 콘도챗봇
- 정보관리기술사
- AWS
- gpt3.5
- IIS
- hackerrank
- s3
- wfastcgi
- 기술사
- 131회정보관리기술사
- 밀키트
- lambda
- 기술사학원
- 정보관리기술사합격
- 12207
- pytorch
- 추천도서
- 자기계발
- 추천시스템
- iso12207
- ISO 12207
- 정보관리
- 밀키트요리
- 인조기프
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |