1. 파이썬 홈페이지 이미지 추출
📌 이미지 위에 우클릭 ▶️ 이미지 주소 복사 버튼 클릭하면 url을 가져올 수 있다
🥑 os.path : 경로명과 파일명에 대한 유용한 함수를 제공하는 모듈
import requests
import os.path
# 1. 파이썬 공식 홈페이지에서 이미지 링크 가져옴
url = 'https://www.python.org/static/img/python-logo@2x.png'
resp = requests.get(url)
🥑 os.path.basename() : 입력받은 경로의 파일명을 반환
# 2. 파일 이름 가지고 오기
image_file_name = os.path.basename(url) # 파일 이름 가져오기
print(image_file_name) # python-logo@2x.png
# 3. 파일 저장.
with open(f'./output_image/{image_file_name}', 'wb') as image_file:
image_file.write(resp.content)
print("이미지 파일로 저장하였습니다.")
2. 야후 이미지 검색 페이지 추출
🥑 https://www.yahoo.com/ 에서 이미지 검색을 한 후 url을 들고 올 것
import requests
from bs4 import BeautifulSoup as bs
import pprint
# 1. 이미지 태그 가져오기
url = 'https://images.search.yahoo.com/search/images;_ylt=Awrg1fJPpOplRwQAMU5XNyoA;_ylu=Y29sbwNncTEEcG9zAzEEdnRpZAMEc2VjA3BpdnM-?p=bts&fr2=piv-web&fr=yfp-t'
resp = requests.get(url)
soup = bs(resp.text, 'html.parser')
tag_images = soup.select('li.ld a > img')
pprint.pprint(tag_images)
# 2. 이미지 저장
dir_save = './output_image/yahoo/' # 저장 경로
for idx, tag in enumerate(tag_images):
#print(tag.get('data-src'))
resp = requests.get(tag.get('data-src'))
with open(f'{dir_save}{idx + 1}.png', 'wb') as image_file:
image_file.write(resp.content)
#print(f'{idx+1} / {len(tag_images)}') # 진행 상황 확인
[ 내용 참고 : IT 학원 강의 ]
'Programming Language > Python' 카테고리의 다른 글
[Python] 넘파이(NumPy) | 배열의 연산, 배열의 인덱싱과 슬라이싱 (0) | 2024.03.11 |
---|---|
[Python] 넘파이(Numpy) | 정의, 배열 생성 방법 및 관련 함수, 데이터 형식 (0) | 2024.03.11 |
[Python] 웹 크롤링 | BeautifulSoup의 select_one() 과 select(), CSS select 지정 형식 (0) | 2024.03.08 |
[Python] 웹 크롤링 | BeautifulSoup 사용법, find() 와 find_all() (1) | 2024.03.08 |
[Python] 웹 크롤링 | request 와 requests, 크롤링 허용 여부 확인방법 (1) | 2024.03.07 |