以下是一个简单的 Python 网络爬虫案例,用于从网站上提取数据:

  1. import requests
  2. from bs4 import BeautifulSoup
  3. url = 'https://example.com'
  4. response = requests.get(url)
  5. soup = BeautifulSoup(response.text, 'html.parser')
  6. # 获取页面标题
  7. title = soup.title.string
  8. print(title)
  9. # 获取所有链接
  10. links = []
  11. for link in soup.find_all('a'):
  12. links.append(link.get('href'))
  13. print(links)
  14. # 获取所有图像
  15. images = []
  16. for img in soup.find_all('img'):
  17. images.append(img.get('src'))
  18. print(images)

这个简单的爬虫可以帮助你获取网页标题、链接和图像等信息。但请注意,对于任何网络爬虫,请遵守网站的使用条款和服务协议,以确保你不会违反任何法律或规定。

作者:admin  创建时间:2023-03-17 23:17
 更新时间:2023-07-13 15:23