data analysis
what is corpus.? 코퍼스란?
HR대장
2020. 1. 16. 14:24
728x90
코퍼스 = 말뭉치
코퍼스 = 보통 여러 단어들로 이루어진 문장
분석하려는 대상, 문서, 데이터셋이라 할 수 있겠다.
굳이 분류를 하자면,
한가지 언어로 이루어진 코퍼스 = 단일 언어 코퍼스 (monolingual)
한가지 이상 언어로 이루어진 코퍼스 = 이중 언어 코퍼스 (billingual)
Simply, we can say, corpus is the "dataset" in general machine learning task.
728x90