request 크롤링에 앞서 내가 정보를 얻고 싶은 사이트로 접속합니다.
저는 예시로 직방에 아래 사이트로 접속했습니다!
https://www.zigbang.com/home/apt/danjis/12313
서울숲1차푸르지오
성동구 금호동4가 - 888세대 - 2007.07 입주
www.zigbang.com
해당 사이트에서 F12를 누릅니다.
F12를 누르시면 나오는 창(개발자모드)에서 Network라고 있는 탭을 선택해줍니다.
다음으로 정보를 얻을 단지를 클릭해줍니다.
다음에 왼쪽에 리스트에서 한개씩 눌러가며, 우측에 Preview에서 정보가 업데이트 되는지 확인합니다.
여기에서 내가 원하는 정보를 찾았다면 성공입니다!
저는 해당 단지에 관련된 여러 정보들을 얻고 싶었습니다!
다음으로 Headers를 눌러서 Request URL을 눌러서 주소를 복사해줍니다.
자 이제 페이지에서 우리가 크롤링할 정보를 찾고, 그것을 불러올 URL정보를 얻었습니다.
이제 Python으로 돌아가서 아래와 같이 코드를 작성해줍니다.
여기서 우리가 위에서 얻은 Request URL을 입력해주면됩니다.
import requests, json
req = requests.get(f"https://apis.zigbang.com/apt/danjis/12313")
if 'NotFoundError' not in str(req.text):
data1 = json.loads(req.text)
data1
그러면 아래와 같이 해당 주소의 Preview에서 확인한 정보를 정상적으로 출력하는 것을 확인할 수 있습니다.
'자동화 매크로' 카테고리의 다른 글
구글 드라이브 colaboratory 연동 및 실습코드 보는방법 (0) | 2023.08.16 |
---|---|
[MAC] Jupyter Notebook에서 root 폴더 위치 찾기! (0) | 2023.07.12 |
[키홈] Python selenium 자동화 cheat sheet (0) | 2023.06.24 |
내곡 테니스장 예약 매크로 프로그램, 파이썬(python)으로 직접 만들어보기! (0) | 2023.05.26 |
부동산 실거래가 자동 수집해서 내 집 마련하기! 아파트 실거래가 매크로 (6) | 2023.05.23 |