以下是一个简单的 Python 网络爬虫案例,用于从网站上提取数据:
import requests
from bs4 import BeautifulSoup
url = 'https://example.com'
response = requests.get(url)
soup = BeautifulSoup(response.text, 'html.parser')
# 获取页面标题
title = soup.title.string
print(title)
# 获取所有链接
links = []
for link in soup.find_all('a'):
links.append(link.get('href'))
print(links)
# 获取所有图像
images = []
for img in soup.find_all('img'):
images.append(img.get('src'))
print(images)
这个简单的爬虫可以帮助你获取网页标题、链接和图像等信息。但请注意,对于任何网络爬虫,请遵守网站的使用条款和服务协议,以确保你不会违反任何法律或规定。
作者:admin 创建时间:2023-03-17 23:17
更新时间:2023-07-13 15:23
更新时间:2023-07-13 15:23