티스토리 뷰
728x90
코퍼스 = 말뭉치
코퍼스 = 보통 여러 단어들로 이루어진 문장
분석하려는 대상, 문서, 데이터셋이라 할 수 있겠다.
굳이 분류를 하자면,
한가지 언어로 이루어진 코퍼스 = 단일 언어 코퍼스 (monolingual)
한가지 이상 언어로 이루어진 코퍼스 = 이중 언어 코퍼스 (billingual)
Simply, we can say, corpus is the "dataset" in general machine learning task.
728x90
'data analysis' 카테고리의 다른 글
| What is EDA(Exploratory Data Analysis)? (0) | 2020.02.25 |
|---|---|
| [regression] linear regression (0) | 2020.02.06 |
| [데이터 시각화] 유용한 사이트 (0) | 2020.01.31 |
| [classification] k-nn algorithm (0) | 2020.01.21 |
| setting enviroment pytorch 개발환경 세팅 (0) | 2020.01.14 |
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- r
- gpt3.5
- 정보관리기술사독학
- FLASK
- pytorch
- 정보관리기술사
- 기술사
- hackerrank
- s3
- 콘도챗봇
- 자기계발
- 챗봇
- 정보관리기술사합격
- wfastcgi
- 추천시스템
- 밀키트
- 머신러닝
- 기술사학원
- 131회정보관리기술사
- AWS
- 밀키트요리
- 12207
- iso12207
- ISO 12207
- lambda
- 정보관리
- 로블록스
- IIS
- 추천도서
- 인조기프
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
글 보관함