
안녕하세요. 은행 IT운영부 이지성과장입니다. 원래는 "의사결정나무"를 다음 포스팅으로 다루려고 했으나, 조금 가벼운 주제를 먼저 소개해 드리려 합니다. 그 전에 "데이터 시각화"에 대한 이야기를 좀 해보려 합니다. 인간은 매우 시각적인 동물이라고 합니다. 인간은 자연적으로 시각적 입력을 다른 어떤 방법보다도 빠르게 인지 한다고 합니다. 그만큼 우리에게 시각이 중요하다는 의미인데, 보통 사람이 감각기관을 통해 획득하는 정보의 80% 이상이 시각을 통해 얻어진다고 합니다. 이런 근거로 우리에게 왜 데이터 시각화가 효과적이고, 각종 보고서에서 왜 사용되는지 이해가 되실겁니다. 사실 저도 중간관리자로서 말로 장황하게 설명하는 보고서 보다는, 그래프로 한눈에 보이는 보고서를 봤을 때, "아, 이 보고서가 더 명..
"tidytext" package에 대해 알아보고 사용해 보려 합니다. 정돈 텍스트 형식이라고도 불리는데, 특징은 1개 행마다 1개의 토큰이 있게 데이터를 구성하는 겁니다. (1행당 1토큰) 정돈 텍스트 형식의 장점은 gplot2나 dplyr을 활용하여 텍스트를 요약, 시각화를 효율적으로 할 수 있습니다. 기본적인 사용법은 아래와 같습니다. 1. text를 dplyr패키지를 사용해 변환 2. tidytext의 unnest_tokens를 이용해 1행 1토큰으로 변환 github 링크 : https://github.com/jasonlee8318/R-programming/blob/master/tidytext_1.R 참고하기 좋은 사이트 : https://junhewk.github.io/text/2017/06/..
- Total
- Today
- Yesterday
- r
- wfastcgi
- 챗봇
- AWS
- 밀키트
- 131회정보관리기술사
- 정보관리기술사
- 추천시스템
- lambda
- 로블록스
- pytorch
- 추천도서
- 기술사학원
- 정보관리기술사합격
- hackerrank
- gpt3.5
- 12207
- s3
- FLASK
- iso12207
- 기술사
- 자기계발
- 콘도챗봇
- ISO 12207
- IIS
- 정보관리기술사독학
- 정보관리
- 인조기프
- 머신러닝
- 밀키트요리
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |