Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | 7 |
8 | 9 | 10 | 11 | 12 | 13 | 14 |
15 | 16 | 17 | 18 | 19 | 20 | 21 |
22 | 23 | 24 | 25 | 26 | 27 | 28 |
29 | 30 | 31 |
Tags
- 코딩동아리
- 멋쟁이사자처럼대학
- 멋사 10기
- IT동아리
- 웹동아리
- 디스코드봇
- 백엔드
- 크롤링
- 멋사 합격
- 멋쟁이 사자처럼
- 멋사 면접
- 멋쟁이사자처럼 서류
- 파이썬
- 멋쟁이사자처럼11기
- 멋사11기
- discord
- 멋사10기
- 깃허브
- 멋사12
- 파이썬 크롤링
- 멋쟁이사자처럼
- 기사 제목 크롤링
- django
- 멋사
- 멋쟁이사자처럼10기
- API
- 알림봇
- 멋사 서류평가
- ㅏㄴ
- 멋사 서류
Archives
- Today
- Total
ACHO.pk devlog
[멋쟁이사자처럼10기] Python으로 검색어 뉴스 기사 제목 크롤링 + 엑셀 파일 저장 본문
멋사 서울여대 스터디에서 Python 심화 응용 미션을 진행했다.
크롤링하기를 원하는 페이지와 뉴스 검색어를 입력해서 해당 키워드가 포함되거나 관련된 뉴스 제목을 크롤링하고 얻은 값을 엑셀에 표로 나타내야 했다.
멋사 서울여대 스터디 Python 응용 미션
1) 기본 세팅
-beautifulsoup4 install
-Requests install
-Pandas install
-Openpyxl install
2) HINT
-url 분석하여 페이지 검색어 + 페이지 번호 입력하는 코드 짜기
검색할 키워드를 입력하고, 크롤링할 페이지의 숫자를 입력하면 키워드와 연관된 뉴스의 기사제목이 10개가 출력된다. 갯수는 줄일수도 늘릴수도 있다.
크롤링한 결과를 번호, 제목으로 엑셀 파일에 저장하면 된다.
엑셀 파일에 저장하는 방법
import pandas as pd
import openpyxl
wb = openpyxl.Workbook()
sheet = wb.active
sheet.append(["번호", "제목"])
num = 0
for i in results:
num +=1
title = i.text
sheet.append([num, title])
wb.save("new.xlsx")
완성된 코드는 아래 깃허브에서 확인 !
https://github.com/Acho-mj/Likelion10-study/tree/main/python_crawling
'멋쟁이사자처럼' 카테고리의 다른 글
[멋쟁이사자처럼10기] python_SMTP 서버로 메일보내기 (0) | 2022.05.07 |
---|---|
[멋쟁이사자처럼10기] Python를 이용해서 언어를 감지하고, 번역하기 (0) | 2022.05.07 |
[멋쟁이사자처럼10기] Python_API를 이용해 날씨 정보 받아오기 (0) | 2022.05.01 |
[멋쟁이사자처럼10기] Python 크롤링으로 뉴스 기사 제목 추출하기 (0) | 2022.05.01 |
[멋쟁이사자처럼10기] Html/CSS로 나만의 이력서 만들기 (0) | 2022.04.11 |
Comments