-
파이썬 BeautifulSoup를 이용하여 네이버 웹툰 제목 가져오기파이썬/데이터 주무르기 2019. 12. 20. 21:49
우선 네이버 웹툰으로 접속하자
https://comic.naver.com/webtoon/weekday.nhn
크롬 브라우저를 사용한다면 F12를 눌러보면 개발자 도구창이 열린다.
하기에 붉은 사각형으로 표시된 버튼을 클릭해보자
그 후 아무 웹툰 제목이나 클릭해보자 본인은 '유미의 세포들'을 클릭~
클릭하여 표시된 HTML 태그를 살펴보자
웹툰의 제목값은 a태그의 title속성값임을 알수 있다.
하기의 소스를 실행한다.
1234567891011from bs4 import BeautifulSoupfrom urllib.request import urlopenurl = 'https://comic.naver.com/webtoon/weekday.nhn' # 웹툰 페이지 주소page = urlopen(url)soup = BeautifulSoup(page, 'html.parser') # url에 해당하는 페이지의 HTML 태그를 저장한다.soup = soup.find_all('a', 'title') # a태그에 title속성을 가지고 있는 HTML 태그들을 filtering하여 저장한다.for each in soup :print(each.attrs['title']) # title 속성값을 출력한다cs 실행결과
'파이썬 > 데이터 주무르기' 카테고리의 다른 글
DataFrame 합치기(merge) (0) 2019.12.18 CCTV 현황 그래프로 분석하기 (0) 2019.12.18 pandas 기초 익히기 (0) 2019.12.18 파이썬에서 텍스트 파일과 엑셀 파일 읽기 - pandas <2> (0) 2019.12.18 파이썬에서 텍스트 파일과 엑셀 파일 읽기 - pandas <1> (0) 2019.12.17