当前位置: 首页 > news >正文

品牌形象网站建设/拼多多代运营公司十大排名

品牌形象网站建设,拼多多代运营公司十大排名,品牌的佛山网站建设价格,学做美食的网站视频bs4解析 bs4解析是python中独有的数据解析方式 bs4数据解析的原理 1.实例化一个BeautifulSoup对象,并且将页面源码数据加载到该对象中 2.通过调用BeautifulSoup对象中相关的属性或方法进行标签定位和数据提取 环境安装: 1.pip install bs4 2.pip insta…

bs4解析

bs4解析是python中独有的数据解析方式

  • bs4数据解析的原理
    1.实例化一个BeautifulSoup对象,并且将页面源码数据加载到该对象中
    2.通过调用BeautifulSoup对象中相关的属性或方法进行标签定位和数据提取

  • 环境安装:
    1.pip install bs4
    2.pip install lxml
    这里顺带将pip如何设置成国内源的方法链接附上
    链接在这

  • 如何实例化BeautifulSoup对象:
    from bs4 import BeautifulSoup
    将爬取到的html页面加载到对象中,具体代码如下:

from bs4 import BeautifulSoup
import requests
if __name__ == '__main__':url="https://www.baidu.com/"headers = {"User-Agent": "Mozilla/5.0(Windows NT 10.0;Win64;x64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 88.0.4324.150 Safari / 537.36"}resp=requests.get(url=url,headers=headers)resp.encoding="utf-8"# 将互联网上获取的页面源码加载到该对象中page_text=resp.textsoup=BeautifulSoup(page_text,"lxml")print(soup)

打印出来的soup就是一个html页面文件

相关属性和方法

soup.tagName:返回的是文档中第一次出现的对应的标签
soup.find():与上者等同,但可以进行属性定位,如:soup.find('div',class_='song')
因为class是python关键字,所以这个地方是写成class_
soup.find_all('tagName'):返回符合要求的所有标签
select:select('某种选择器') 返回的是一个数组
获取标签之间的文本数据:soup.a.text/string/get_text()text/get_text()可以获取某一个标签中的所有文本内容string:只能获取直系文本内容
获取标签中的属性值:soup.a['href']

使用案例:

from bs4 import BeautifulSoup
import requests
import os
if __name__ == '__main__':# 创建一个文件夹 保存所有图片if not os.path.exists("./qiutuLibs2"):os.mkdir("./qiutuLibs2")headers = {"User-Agent": "Mozilla/5.0(Windows NT 10.0;Win64;x64) AppleWebKit / 537.36(KHTML, likeGecko) Chrome / 88.0.4324.150 Safari / 537.36"}src_list=[]url = "https://www.qiushibaike.com/imgrank/page/%d/"for pageNum in (1,13):new_url=format(url%pageNum)resp=requests.get(url=new_url,headers=headers)resp.encoding="utf-8"# 将互联网上获取的页面源码加载到该对象中page_text=resp.textsoup=BeautifulSoup(page_text,"lxml")for src in soup.select(".illustration"):src_list.append(src['src'])for src in src_list:src="https:"+srcimg_data=requests.get(url=src,headers=headers).contentimg_Name=src.split('/')[-1]img_Path='./qiutuLibs2/'+img_Namewith open(img_Path,"wb") as fp:fp.write(img_data)print(img_Path+"下载成功")
http://www.jmfq.cn/news/4947499.html

相关文章:

  • 怎样利用网站做推广/北京网站seo公司
  • 推荐几个网站/百度ai入口
  • 苏州网站公司/优化近义词
  • 阳谷网站建设/全球网站排名查询
  • 公司网站建设情况说明/网站优化公司大家好
  • 网站建设及验收标准/网址百度刷排名
  • 网站备案号在哪儿查询/软文有哪些发布平台
  • 万盛集团网站建设/恩施seo整站优化哪家好
  • 微网站建设教程视频教程/公司企业网站制作需要多少钱
  • 网站推广优化平台/如何进行网络推广和宣传
  • 做python一个网站/友链交换有什么作用
  • 建设手机网站费用吗/预测2025年网络营销的发展
  • 建设牌官方网站/深圳网站seo优化公司
  • wordpress安装后设置/seo如何优化排名
  • 建设培训学校网站/中国最新军事新闻
  • 章丘营销型网站建设/百度问一问客服人工在线咨询
  • 大兴专业网站建设公司/互联网推广公司排名
  • wordpress更换背景/seo课程排行榜
  • 优秀大校网站/重庆网络seo公司
  • 网站怎么备案啊/北京seo优化外包
  • 海南网站优化公司/网站推广引流
  • 计科专业毕设做网站/企业推广策略
  • web开发技术介绍/seo测试
  • 利用百度云做网站/最近爆发什么病毒感染
  • 常州做的网站的公司网站/北京百度搜索排名优化
  • 美国做3d+h动画的网站/个人永久免费自助建站
  • 做不做我女朋友的网站/促销活动推广方案
  • 推广公众号平台的公司/seo排名培训学校
  • 网站开发技术教程/推广方案策略怎么写
  • 免费做网站软件下载/网站运营策划书