Python/오픈 API 활용기
파이썬 크롤링 예제, 메이저리그 경기 데이터 수집하기
데이터 분석 및 모델링을 위해서 가장 중요한 것은 뭐니뭐니해도 데이터이다. 하지만 일반인들이 분석 및 모델링을 위한 데이터를 수집하기는 쉽지 않다. 그런 의미에서 웹크롤링은 굉장히 유용하다. 웹에 많은 데이터들이 있고 빠르고 쉽게 수집할 수 있기 때문이다. 웹크롤링을 하지 않기 수작업으로 한땀한땀 수집할 수도 있지만, 5분이면 할 일을 50분에 걸쳐서 하기 때문에 굉장히 비효율적이다. 오늘은 파이썬 크롤링 예제, 메이저리그 경기 데이터 수집하기에 대해서 알아보았다. HTML 삽입 미리보기할 수 없는 소스 웹크롤링을 애기할 때 크게 2가지 방법이 있는 듯 하다. 하나는 책에서도 많이 나오는 http(hyper text transfer protocol)를 이용하여 필요한 웹페이지의 HTML을 수집한다. 그리..