当前位置: 首页 > news >正文

查询网站空间的服务商/上海短视频seo优化网站

查询网站空间的服务商,上海短视频seo优化网站,荔湾网站制作,湖北省勘察设计协会网站BeautifulSoup4 官方文档 是一个Python库,用于从HTML和XML文件中提取数据。它与您最喜欢的解析器一起使用,提供导航,搜索和修改解析树的惯用方法。它通常可以节省程序员数小时或数天的工作量。 1.安装BeautifulSoup4 pip install bs4 2.详细操…

BeautifulSoup4

官方文档

  是一个Python库,用于从HTML和XML文件中提取数据。它与您最喜欢的解析器一起使用,提供导航,搜索和修改解析树的惯用方法。它通常可以节省程序员数小时或数天的工作量。

1.安装BeautifulSoup4

pip install bs4

 2.详细操作

from bs4 import BeautifulSoup
from urllib import request
#获取网页内容
base_url = 'http://langlang2017.com/route.html'
response  = request.urlopen(base_url)
html = response.read()#数据解析(从页面当中提取数据)
#创建bs4对象
soup = BeautifulSoup(html,'lxml')
#格式化输出对象中的内容
content = soup.prettify()#提取页面当中的指定内容
# print(soup.title)  #获取title内容#一  只能匹配到第一个标签内容
#1.tag(name)
# print(soup.name)   #输出文档类型
# print(soup.div.name) #输出标签名
#2attrs
# print(soup.title.attrs)
# print(soup.img.attrs)#3修改属性值
img = soup.img.attrs
# print(img)
domain = 'http://www.langlang2017.com'
img["src"] = domain+ img["src"]
# print(img)#4删除
img= soup.img.attrs
# print(img)
del  img["alt"]
# print(img)#
#1获取文本
# print(soup.title)
# print(soup.title.attrs)
# print(soup.title.name)
#格式:标签名.string
# print(soup.title.string)#三 标签名.contents 获取子节点列表
head = soup.head.contents
# print(head)
# print(head[3])#标签名.children  --子节点
head_children = soup.head.children
# for i in head_children:# print(i)#便签名.descendants  --子孙节点
# print(soup.div)
# for i in soup.div.descendants:
#     print(i)#搜索文档 find_all()
# print(soup.meta)  #只能获取一个
# for i in soup.find_all('meta'):
#     print(i)#标签列表
# print(soup.find_all(["h1","h2"]))#关键词
# print(soup.find_all(id='weixin'))#四 css选择器 soup.select()
#通过类名查找
# print(soup.select('.logo'))
#通过标签名查找
# print(soup.select('a'))
#通过id查找
# print(soup.select('#weixin'))

3.注意:运行报错

bs4.FeatureNotFound: Couldn't find a tree builder with the features you requested: lxml. Do you need 

解决:安装 lxml包 

pip install lxml

 

转载于:https://www.cnblogs.com/mswei/p/9337259.html

http://www.jmfq.cn/news/4767157.html

相关文章:

  • 滨海新区网站建设/济宁百度推广电话
  • 做企业网站还有钱挣吗/河南网站优化公司
  • 做定制网站价格/百度站长平台官网登录入口
  • 代做淘宝联盟网站/爱链工具
  • 有没有通信专业业余做兼职的网站/fifa最新排名出炉
  • wordpress媒体库加一个分类/seo推广专员
  • 乐云seo快速网站建设/东莞网站设计
  • 东莞网站制作南城/宣传推广网络推广
  • 新疆维吾尔族城乡建设厅网站/竞价推广托管公司价格
  • 网站标题栏怎么做/100个商业经典案例
  • 厦门网站建设外包/企业seo服务
  • 新疆生产建设兵团体育局网站/谷歌 google
  • wordpress主题自定义打不开/seo西安
  • 湖州 网站建设/在线注册网站
  • 医院做网站的意义/上海百度推广排名
  • 兰州企业建设网站/seo软件视频教程
  • 上海做网站品牌公司有哪些/网络推广网站排名
  • 跳转网站代码/深圳居家办公
  • 苏州市智信建设职业培训学校网站/怎样在百度上免费建网站
  • 台州做网站seo/百度一下网页版浏览器百度
  • 建设seo网站/2023年中国进入一级战备状态了吗
  • 汉口做网站jw100/提升seo排名平台
  • 淄博专业网站设计/seo草根博客
  • 做健身网站开题报告/怎样做网络推广营销
  • 江苏建设主管部门网站/品牌形象推广
  • 阿里云域名空间网站建设/公司如何建立网站
  • 外包加工网站/南宁seo推广公司
  • 制作网页与网站/搜索引擎在线
  • 佛山新网站建设服务/seo整站优化外包公司
  • WordPress主题在线生成/长沙seo管理