본문 바로가기

하루코딩/python 하루코딩

관람정보 & 기사 크롤링

728x90
반응형

from bs4 import BeautifulSoup
import requests

# 실습1. 국립중앙박물관 관람 정보
mus = requests.get(html_mus)
soup = BeautifulSoup(mus.text, 'html.parser')
time1 = soup.select_one("li.info > strong")

time2 = soup.select("div.info-txt > ul > li")

cost = soup.select_one("li.admission > strong")

print(f"{time1.text} {time2[0].text} {time2[1].text} {time2[2].text}")
print(f"{cost.text.strip()} / {time2[3].text}")

# 실습2. 전자 신문 메인 기사 크롤링

res = requests.get(html_url)
soup = BeautifulSoup(res.text, 'html.parser')
title = soup.select_one(".article_header #article_title_h2")

with open("news.txt", "w", encoding="utf-8") as file:
    file.write(f"{title.text.strip()}\n {date.text}")
    for i in contents:
        file.write(i.text)
   
반응형