●펌정보/작업 [GitHub] GitHub Action을 사용하여 자동 스크래핑(scraping)과 Push 구현하기
이전
다음
링크
본문
●펌정보/작업 [GitHub] GitHub Action을 사용하여 자동 스크래핑(scraping)과 Push 구현하기
https://chanhuiseok.github.io/posts/git-1/
▶ 1. 파이썬으로 스크래핑 기능 만들기
뉴스 사이트 링크 : https://www.yna.co.kr/safe/news
import requests
from bs4 import BeautifulSoup
import json
import os
import sys
BASE_DIR = os.path.dirname(os.path.abspath(__file__))
print('뉴스기사 스크래핑 시작')
req = requests.get('https://www.yna.co.kr/safe/news')
# req = requests.get('https://www.yna.co.kr/safe/news')
req.encoding= None
html = req.content
soup = BeautifulSoup(html, 'html.parser')
datas = soup.select(
'div.contents > div.content01 > div > ul > li >article > div >h3'
)
data = {}
for title in datas:
name = title.find_all('a')[0].text
url = 'http:'+title.find('a')['href']
data[name] = url
with open(os.path.join(BASE_DIR, 'news.json'), 'w+',encoding='utf-8') as json_file:
json.dump(data, json_file, ensure_ascii = False, indent='t')
print('뉴스기사 스크래핑 끝')
뉴스 사이트 스크래핑 결과
j:\data_2t_i_drive\python\m3u2strm\news.json
☞ https://11q.kr 에 등록된 자료 입니다. ♠ 정보찾아 공유 드리며 출처는 링크 참조 바랍니다♠
관련자료
-
링크
-
이전
-
다음
댓글 0
등록된 댓글이 없습니다.