반응형
다음과 같은 meta 테그의 특정 속성만 추출하고 싶은 경우가 있다
source_id = '25441767'
# source_id = '1000623206'
rq = requests.get(new_url + source_id, headers=rnd_header)
souprq = BeautifulSoup(rq.content, 'html.parser')
souprq.select('meta')
poi = souprq.select_one('meta[property="og:title"]')['content']
address = souprq.select_one('meta[property="og:description"]')['content']
# '당신을 좋은 곳으로 안내 할 지도' == None
print(poi)
print(address)
원하는 정보 추출 완료~!
참조:
[python] 메타태그 크롤링 하는 법 (tistory.com)
[python] 메타태그 크롤링 하는 법
import requests from bs4 import BeautifulSoup url = 'https://movie.naver.com/movie/bi/mi/basic.nhn?code=171539' headers = {'User-Agent' : 'Mozilla/5.0 (Windows NT 10.0; Win64; x64)AppleWebKit/537.36 (KHTML, like Gecko) Chrome/73.0.3683.86 Safari/537.36'} d
sso-feeling.tistory.com
추가적으로 참조하면 좋을 사이트 (카카오맵 사용시)
-
반응형
'Tools & Tips > code_snippets' 카테고리의 다른 글
GPU memory 상태 확인 방법 (0) | 2022.09.25 |
---|---|
jupyter notebook 한글 폰트 적용 방법 (0) | 2022.09.14 |
구글 코랩(google colab) 환경인지 아닌지 확인하는 방법 (0) | 2022.09.14 |
댓글