当前位置: 首页 > news >正文

用jsp做的购物网站/网站搭建步骤

用jsp做的购物网站,网站搭建步骤,手机版网站开发人员选项,域名解析到别的网站案例:爬取使用搜狗根据指定词条搜索到的页面数据(例如爬取词条为‘周杰伦的页面数据)import urllib.request# 1.指定urlurl https://www.sogou.com/web?query周杰伦2.发起请求:使用urlopen函数对指定的url发起请求,该函数返回一个响应对象,…

案例:爬取使用搜狗根据指定词条搜索到的页面数据(例如爬取词条为‘周杰伦'的页面数据)

import urllib.request

# 1.指定url

url = 'https://www.sogou.com/web?query=周杰伦'

'''

2.发起请求:使用urlopen函数对指定的url发起请求,

该函数返回一个响应对象,urlopen代表打开url

'''

response = urllib.request.urlopen(url=url)

# 3.获取响应对象中的页面数据:read函数可以获取响应对象中存储的页面数据(byte类型的数据值)

page_text = response.read()

# 4.持久化存储:将爬取的页面数据写入文件进行保存

with open("sougou.html","wb") as f:

f.write(page_text)

print("写入数据成功")

f.close()

编码错误

【注意】上述代码中url存在非ascii编码的数据,则该url无效。如果对其发起请求,则会报如下错误:

UnicodeEncodeError: 'ascii' codec can't encode characters in position 15-17: ordinal not in range(128)

url的特性:url不可以存在非ASCII编码字符数据,url必须为ASCII编码的数据值。所以我们在爬虫代码中编写url时,如果url中存在非ASCII编码的数据值,则必须对其进行ASCII编码后,该url方可被使用。

上面的“周杰伦” 不是ASCII编码字符数据,所以url就会变成无效的url,不符合url特性,所以报错误

所以必须对url中的非ascii的数据进行ascii的编码,则该url方可被发起请求:

需要用到 urllib.parse

方法 1:使用quote函数

quote函数作用:对url中所存在的特殊字符进行ASCII的编码,把url中的非ascii编码的字符单独取出来,使用quote函数进行转码,

转码之后,把转码的结果拼接到原有的url当中。

import urllib.request

import urllib.parse

# 1.指定url

url = 'https://www.sogou.com/web?query=周杰伦'

word = urllib.parse.quote("周杰伦")

# 查看转码后结果

print(word)

# %E5%91%A8%E6%9D%B0%E4%BC%A6

from urllib.request import urlopen

import urllib.parse

# 1.指定url

url = 'https://www.sogou.com/web?query='

# url的特性:url不可以存在非ASCII编码字符数据

word = urllib.parse.quote("周杰伦")

# 将编码后的数据值拼接回url中

url = url+word # 有效url

'''

2.发起请求:使用urlopen函数对指定的url发起请求,

该函数返回一个响应对象,urlopen代表打开url

'''

response = urlopen(url=url)

# 3.获取响应对象中的页面数据:read函数可以获取响应对象中存储的页面数据(byte类型的数据值)

page_text = response.read()

# 4.持久化存储:将爬取的页面数据写入文件进行保存

with open("周杰伦.html","wb") as f:

f.write(page_text)

print("写入数据成功")

以上就是本文的全部内容,希望对大家的学习有所帮助,也希望大家多多支持脚本之家。

http://www.jmfq.cn/news/5178763.html

相关文章:

  • 女生学建筑工程技术就业前景/关键词优化有哪些作用
  • 海口网吧/seo知识总结
  • 可以将自己做的衣服展示的网站/先做后付费的代运营
  • 济南网站制作公司排名/郑州好的seo外包公司
  • 网站系统开发怎么做/网站建设公司官网
  • 北京西站疫情/网站建设网站定制
  • 完全的图片宣传网站怎么做/最新seo网站优化教程
  • 广州各区进一步强化/青岛seo网络优化公司
  • 做排版的网站/百度网站域名注册
  • 手游门户网站模块/网站流量来源
  • 做网站是用啥软件做的/手机网站怎么优化关键词
  • 电商系统平台开发/广州谷歌优化
  • 高端html5网站设计工作室织梦模板 dedecms5.7/网站设计公司有哪些
  • 百度做网站审核要多久/新网站百度收录
  • 信宜网站建设公司/最新疫情爆发
  • 服装购物网站建设/福建键seo排名
  • 网站开发技术论文/网络推广公司名字大全
  • 前端培训多少钱/关键词怎么优化
  • 临沂恒商做网站/百度网址链接
  • 网站维护和推广/重庆网站搜索引擎seo
  • 发布页全部页面设计/seo综合查询 站长工具
  • 做网站服务器多少钱/伟哥seo博客
  • 南昌网站系统/百度标记号码认证平台
  • 在线制作网站源码/百度站长统计工具
  • 网站前台设计/哪里有网页设计公司
  • 优秀的政府网站建设提供商/推广网站多少钱
  • 做火影忍者网站的格式/湖南seo优化
  • java做的网站源码/直播代运营公司
  • 禹城网站建设/如何建立企业网站
  • 做调查赚钱靠谱的网站/中国婚恋网站排名