py/requests
http를 가져오기전 응답상태 체크 하는법
호성동쎕쎕이
2020. 9. 19. 11:17
import requests
r = requests.get('https://www.naver.com/')
r.status_code
// 200
200이 떴다면 성공이다 http 상태 코드 마다 상황이 다르니 간단하게 설명하고 자세한건 위키 백과 링크 남긴다
1XX (조건부 응답)
2XX (성공)
3XX (리다이렉션 완료)
4XX (요청 오류)
5XX (서버 오류)
ko.wikipedia.org/wiki/HTTP_%EC%83%81%ED%83%9C_%EC%BD%94%EB%93%9C
HTTP 상태 코드 - 위키백과, 우리 모두의 백과사전
위키백과, 우리 모두의 백과사전. 둘러보기로 가기 검색하러 가기 아래는 HTTP(하이퍼텍스트 전송 프로토콜) 응답 상태 코드의 목록이다. IANA가 현재 공식 HTTP 상태 코드 레지스트리를 관리하고 ��
ko.wikipedia.org
웹 크롤링 하다가 403 코드를 가끔 발견 하는데 에러가 날수도 있으니
headers = {'User-Agent': 'Mozilla/5.0 (Macintosh; Intel Mac OS X 10_11_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36'}
headers = {'User-Agent':'Chrome/66.0.3359.181'}
headers = {'User-Agent':'Mozilla/5.0', 'referer' : 'http://www.naver.com'}
중간에 헤더를 추가해주자 403 코드가 뜬다면