일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 |
- 자바스크립트 객체
- PubSub 패턴
- 씨쁠쁠
- 자바스크립트
- Server Side Rendering
- react
- 자바 프로젝트
- React.js
- Image 컴포넌트
- Next/Image 캐싱
- 브라우저 동작
- Next.js
- 자바스크립트 컴파일
- 네이버 부스트캠프 멤버십
- 비디오 스트리밍
- React ssr
- 파이썬 웹크롤링
- 멘션 추천 기능
- 웹크롤링
- 네이버 부스트캠프
- beautifulsoup
- 네이버 부캠
- c++
- 부스트캠프
- git checkout
- 파이썬 코딩테스트
- 프로그래머스
- 스택
- 파이썬
- 코딩테스트
- Today
- Total
목록웹크롤링 (2)
코린이의 개발 일지

안녕하세요 폴라민 입니다. 오늘은 저번 포스팅에 이어서 웹툰 웹크롤링 하기 2탄 입니다. 저번 포스팅에서 설명했던 부분은 그냥 넘어갈 예정이라 혹시 Beautifulsoup을 처음 다뤄 보시는 분들은 아래 포스팅을 참고해주시면 감사하겠습니다. - 완전 기본적인 크롤링하기 https://polarmin.tistory.com/32 - 네이버 웹툰 제목 크롤링하기 https://polarmin.tistory.com/33 자 그럼 시작하겠습니다. 저번과는 다르게 이번에는 별점 정보를 가져와서 활용할 건데 보아 하니 전체 웹툰을 보여주는 페이지는 별점 정보가 없더군요... Beautifulsoup은 셀레니움과 다르게 동적으로 크롤링을 할 수가 없어서 하는 수 없이 특정 요일 웹툰들만 나온 페이지에서 크롤링을 진행..

안녕하세요 폴라민입니다. 오늘은 BeautifulSoup을 사용해서 간단한 텍스트 정보를 가져와 보려고 합니다. BeautifulSoup은 웹페이지 텍스트를 가져오는데 아주 유용한 파이썬 라이브러리 입니다. 우선 간단한 예제를 한번 볼까요? 제 블로그 다른 포스팅 웹 페이지 인데요. 여기서 상단에 글 제목을 가져와 볼겁니다. 우선 가져오기 위해서는 페이지 정보를 알아야하는데 윈도우 크롬 기준을 F12를 누르면 개발자 도구가 뜹니다. 이런식으로 떴을 때, 저기 하트 보이시나요? 하트 오른쪽에 화살표를 누르시면 이런식을 마우스로 가리키면 그 부분의 html 태그가 뜹니다. 저희는 이 태그를 활용해서 글 제목을 가져올겁니다. 아래 코드를 볼까요? import requests from bs4 import Bea..