파이썬 BeautifulSoup를 이용하여 네이버 웹툰 제목 가져오기

파이썬/데이터 주무르기 2019. 12. 20. 21:49

우선 네이버 웹툰으로 접속하자

https://comic.naver.com/webtoon/weekday.nhn

네이버 웹툰

매일매일 새로운 재미, 네이버 웹툰.

comic.naver.com

크롬 브라우저를 사용한다면 F12를 눌러보면 개발자 도구창이 열린다.

하기에 붉은 사각형으로 표시된 버튼을 클릭해보자

그 후 아무 웹툰 제목이나 클릭해보자 본인은 '유미의 세포들'을 클릭~

클릭하여 표시된 HTML 태그를 살펴보자

웹툰의 제목값은 a태그의 title속성값임을 알수 있다.

하기의 소스를 실행한다.

1
2
3
4
5
6
7
8
9
10
11

from bs4 import BeautifulSoup
from urllib.request import urlopen
 
url = 'https://comic.naver.com/webtoon/weekday.nhn'     # 웹툰 페이지 주소
page = urlopen(url)
soup = BeautifulSoup(page, 'html.parser')   # url에 해당하는 페이지의 HTML 태그를 저장한다.
 
soup = soup.find_all('a', 'title')          # a태그에 title속성을 가지고 있는 HTML 태그들을 filtering하여 저장한다.
 
for each in soup :
    print(each.attrs['title'])              # title 속성값을 출력한다
Colored by Color Scripter

cs

실행결과

'파이썬 > 데이터 주무르기' 카테고리의 다른 글

DataFrame 합치기(merge) (0)	2019.12.18
CCTV 현황 그래프로 분석하기 (0)	2019.12.18
pandas 기초 익히기 (0)	2019.12.18
파이썬에서 텍스트 파일과 엑셀 파일 읽기 - pandas <2> (0)	2019.12.18
파이썬에서 텍스트 파일과 엑셀 파일 읽기 - pandas <1> (0)	2019.12.17

ABOUT ME

해피데브 해피데브

'파이썬 > 데이터 주무르기' 카테고리의 다른 글

티스토리툴바

ABOUT ME

'파이썬 > 데이터 주무르기' 카테고리의 다른 글

관련글 관련글 더보기

티스토리툴바