안녕하세요. 은행 IT 운영부 이지성과장입니다. 오늘은 텍스트 형태의 데이터를 자동으로 가져오는 웹크롤링 기술에 대해서 알아보도록 하겠습니다. 잘 아시겠지만, 웹 상의 모든 페이지는 HTML등의 웹문서로 되어있습니다. 이러한 문서에는 HTML태그 및 데이터가 함께 들어가 있기 때문에 이러한 데이터를 찾아 필요한 데이터를 수집 할 수 있게 되는겁니다. 이것을 잘 활용하면, 특정 영화에 대한 리뷰, 특정 상품에 대한 상품평 등 대량의 텍스트 데이터를 자동으로 수집할 수 있게 되고, 이것을 잘 분석 후 여러가지 상황에서 의사결정에 사용하는 밑거름이 되겠지요! "다잇소" 홈페이지의 예시로 살펴보면, 홈페이지에 접속하셔서 우클릭-소스보기 하시면 html 소스를 보실 수 있습니다. 그리고 여러가지 html 태그와 ..
python programming
2020. 5. 13. 10:22
공지사항
최근에 올라온 글
최근에 달린 댓글
- Total
- Today
- Yesterday
링크
TAG
- lambda
- ISO 12207
- r
- 정보관리
- 정보관리기술사
- 챗봇
- 기술사
- gpt3.5
- s3
- 추천도서
- 인조기프
- 기술사학원
- 정보관리기술사합격
- IIS
- 밀키트요리
- 자기계발
- hackerrank
- 12207
- 로블록스
- AWS
- 머신러닝
- pytorch
- 밀키트
- 추천시스템
- 정보관리기술사독학
- FLASK
- wfastcgi
- 콘도챗봇
- 131회정보관리기술사
- iso12207
| 일 | 월 | 화 | 수 | 목 | 금 | 토 |
|---|---|---|---|---|---|---|
| 1 | 2 | 3 | 4 | 5 | 6 | 7 |
| 8 | 9 | 10 | 11 | 12 | 13 | 14 |
| 15 | 16 | 17 | 18 | 19 | 20 | 21 |
| 22 | 23 | 24 | 25 | 26 | 27 | 28 |
글 보관함