일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 비디오 스트리밍
- 코딩테스트
- PubSub 패턴
- beautifulsoup
- React ssr
- c++
- 자바스크립트 컴파일
- 부스트캠프
- 네이버 부캠
- 자바 프로젝트
- 파이썬 웹크롤링
- 자바스크립트
- Next/Image 캐싱
- git checkout
- 파이썬 코딩테스트
- 프로그래머스
- 씨쁠쁠
- 멘션 추천 기능
- Image 컴포넌트
- 네이버 부스트캠프 멤버십
- 네이버 부스트캠프
- 브라우저 동작
- 웹크롤링
- React.js
- 파이썬
- Server Side Rendering
- Next.js
- 스택
- 자바스크립트 객체
- react
- Today
- Total
목록beautifulsoup (3)
코린이의 개발 일지
안녕하세요 폴라민 입니다. 오늘은 저번 포스팅에 이어서 웹툰 웹크롤링 하기 2탄 입니다. 저번 포스팅에서 설명했던 부분은 그냥 넘어갈 예정이라 혹시 Beautifulsoup을 처음 다뤄 보시는 분들은 아래 포스팅을 참고해주시면 감사하겠습니다. - 완전 기본적인 크롤링하기 https://polarmin.tistory.com/32 - 네이버 웹툰 제목 크롤링하기 https://polarmin.tistory.com/33 자 그럼 시작하겠습니다. 저번과는 다르게 이번에는 별점 정보를 가져와서 활용할 건데 보아 하니 전체 웹툰을 보여주는 페이지는 별점 정보가 없더군요... Beautifulsoup은 셀레니움과 다르게 동적으로 크롤링을 할 수가 없어서 하는 수 없이 특정 요일 웹툰들만 나온 페이지에서 크롤링을 진행..
안녕하세요 폴라민 입니다. 오늘은 네이버 웹툰 사이트에서 beautifulsoup을 이용해 웹툰 목록 가져오기를 해보겠습니다. 요즘은 셀레니움도 많이 쓰던데 동적인 작업할 때는 셀레이움을 사용해야 하지만 저는 텍스트 가져오는 것은 BeautifulSoup이 편하더라구요ㅎㅎ 그럼 시작하겠습니다. 우선 웹툰 사이트로 가봅시다. 링크는 아래 달아둘게요! https://comic.naver.com/webtoon/weekday?order=User 네이버 웹툰 매일매일 새로운 재미, 네이버 웹툰. comic.naver.com 요즘 웹툰들이 정말 셀 수 없이 많아요... 예전에는 개수가 진짜 적어서 모르는 웹툰이 없었는데 지금은 모르는 웹툰이 대다수네요. 아무튼 사이트에 갔으니 크롬 개발자 도구를 켜 줍니다. 윈도우..
안녕하세요 폴라민입니다. 오늘은 BeautifulSoup을 사용해서 간단한 텍스트 정보를 가져와 보려고 합니다. BeautifulSoup은 웹페이지 텍스트를 가져오는데 아주 유용한 파이썬 라이브러리 입니다. 우선 간단한 예제를 한번 볼까요? 제 블로그 다른 포스팅 웹 페이지 인데요. 여기서 상단에 글 제목을 가져와 볼겁니다. 우선 가져오기 위해서는 페이지 정보를 알아야하는데 윈도우 크롬 기준을 F12를 누르면 개발자 도구가 뜹니다. 이런식으로 떴을 때, 저기 하트 보이시나요? 하트 오른쪽에 화살표를 누르시면 이런식을 마우스로 가리키면 그 부분의 html 태그가 뜹니다. 저희는 이 태그를 활용해서 글 제목을 가져올겁니다. 아래 코드를 볼까요? import requests from bs4 import Bea..