data analysis

what is corpus.? 코퍼스란?

HR대장 2020. 1. 16. 14:24
728x90

코퍼스 = 말뭉치

코퍼스 = 보통 여러 단어들로 이루어진 문장

 

분석하려는 대상, 문서, 데이터셋이라 할 수 있겠다.

 

굳이 분류를 하자면,

 

한가지 언어로 이루어진 코퍼스 = 단일 언어 코퍼스 (monolingual)

한가지 이상 언어로 이루어진 코퍼스 = 이중 언어 코퍼스 (billingual)

 

Simply, we can say, corpus is the "dataset" in general machine learning task.

728x90