Python30 python - 웹 스크래핑(크롤링) 기초 ( With Requests & BeautifulSoup ) 우리는 웹을 통해 필요한 정보를 얻습니다. 목적한 데이터를 자동화 프로그램을 통해 수집, 가공하는 행위를 "스크래핑" 혹은 "크롤링" 이라고 합니다. (웹 크롤링은 자동화된 시스템에 의해 최신의 정보를 수집, 가공하는 조직화된 시스템으로 해당 의미에서 스크래핑과는 약간의 의미 차이가 있습니다.) python은 웹 데이터 수집, 가공을 위해 많은 외부라이브러리를 제공합니다. HTTP library 인 Reqeusts 와 HTML, XML Parsing library 인 Beautiful Soup4 (BS4) 를 사용해서 간단한 웹 스크래핑 기술을 살펴보겠습니다. 참조 https://requests.readthedocs.io/en/master/# https://www.crummy.com/software/Be.. 2020. 1. 31. python - 정규 표현식 사용법과 예제( validate IP, email, phone ) 파이썬은 정규 표현식을 위해 내장 라이브러리 re.py를 제공합니다. 간단한 예제와 함께 re.py 가 제공하는 함수를 살펴보겠습니다. 본 장에서는 정규 표현에 사용되는 메타문자(meta characters)의 기본 사용법은 다루지 않습니다. 구동환경은 Anaconda에 내장된 Spyder 툴을 사용했습니다. - python3.7 참조 : https://docs.python.org/3/library/re.html re.compile(pattern, flags=0) - 정규 표현식 패턴을 컴파일 합니다. 컴파일된 정규 표현식 객체는 match(), search() 및 기타 함수에 사용됩니다. prog = re.compile(pattern) result = prog.match(string) 위 구문은 아래와.. 2019. 12. 24. 이전 1 ··· 5 6 7 8 다음