일단 Pyhton 에서 requests를 이용한 예제이기 때문에,
Pip Install Requests
To install Requests, simply run this simple command in your terminal of choice:
설치가 완료되었습니다. 예제 실행화면입니다.
아래에 추가 글 남기겠습니다.
웹 페이지를 긁어 내려면 먼저 페이지를 다운로드해야합니다.
라이브러리를 활용하기 위하여 Requests를 먼저 설치 한 것입니다.
Python requests 라이브러리를 사용하여 페이지를 다운로드 할 수 있습니다. 웹 서버에 GET 요청을 보내고,
웹 서버는 주어진 웹 페이지의 HTML 콘텐츠를 다운로드합니다.
라이브러리를사용하여 만들 수있는 여러 가지 유형의 요청이 있으며 그 중 GET은 하나뿐입니다. 자세한 내용은 API를 확인하십시오.
API확인 경로는 : https://www.dataquest.io/blog/python-api-tutorial/ 입니다.
외국 블로거의 github입니다. ㅎㅎㅎ
간단한 샘플 웹 사이트 http://dataquestio.github.io/web-scraping-pages/simple.html을 다운로드 해 봅니다.
먼저 request.get 메소드를 사용하여 다운로드해야합니다.
구글로 했다가.. content보이시죠?? 엄청 많은 것... 나중에 분석하면 수정해서 다시 올리겠습니다.. ㅎㅎㅎ
일단 Get하는 python 소스입니다.
Python 으로 먼저 진입하시고
import requests page = requests.get("http://dataquestio.github.io/web-scraping-pages/simple.html")
실행 한 후 Response 객체를 얻습니다. 이 객체에는 페이지가 성공적으로 다운로드되었는지 나타내는 status_code 속성이 있습니다.
확인 명령어는
page.status_code
결과는 200이 나오면 정상입니다.
status_code가 200이면 페이지가 성공적으로 다운로드되었음을 의미합니다. 여기서는 상태 코드를 완전히 다루지는 않지만 2로 시작하는 상태 코드는 일반적으로 성공을 나타내고 4 또는 5로 시작하는 코드는 오류를 나타냅니다. (추후 발생하면 분석하고 수정 글 올리겠습니다.)
content 속성을 사용하여 페이지의 HTML 콘텐츠를 인쇄 할 수 있습니다.
확인 명령어는
page.content
소스 코드는 간단한 결과를 확인할 수 있습니다.
하지만 구글로 한다면??... 더 분석이 필요하게 됩니다.ㅎㅎ
오늘은 일단 여기까지 하고 추후 글을 더 나누도록 하겠습니다.
'Computer_IT > Python' 카테고리의 다른 글
No module named _tkinter, please install the python-tk package (0) | 2017.06.08 |
---|