当前位置: 首页 > news >正文

高邮企业网站建设/企业网站模板免费

高邮企业网站建设,企业网站模板免费,【网站建设,网站建设 空间encode和encode_plus的区别可以参考我的另一篇博客:https://blog.csdn.net/weixin_41862755/article/details/120070535 encode和tokenize的区别 区别 encode编码出来的结果,包含开始的[CLS]和结尾的[SEP],所以程序输出结果比原sentence多…

encode和encode_plus的区别可以参考我的另一篇博客:https://blog.csdn.net/weixin_41862755/article/details/120070535

encode和tokenize的区别

区别
  1. encode编码出来的结果,包含开始的[CLS]和结尾的[SEP],所以程序输出结果比原sentence多两位。
  2. tokenize编码出来的结果,就是sentence对应的id,无多余项。
import torch
from transformers import BertTokenizermodel_name = 'bert-base-uncased'# a.通过词典导入分词器
tokenizer = BertTokenizer.from_pretrained(model_name)
sentence = "Hello, my son is laughing."input_ids = torch.tensor(tokenizer.encode(sentence))input_id = tokenizer.tokenize(sentence)
input_id2 = tokenizer.convert_tokens_to_ids(input_id)print("input_ids结果是:",input_ids)
print("input_id2的结果是:",input_id2)

执行结果如下:

input_ids结果是: tensor([ 101, 7592, 1010, 2026, 2365, 2003, 5870, 1012,  102])
input_id2的结果是: [7592, 1010, 2026, 2365, 2003, 5870, 1012]
注意:
input_id2[0:len(input_id2)])  #取得和input_ids一样的结果
http://www.jmfq.cn/news/5326147.html

相关文章:

  • 网站建设开题报告/郑州seo公司
  • 平泉网站建设/cms自助建站系统
  • 福建省住房城乡和建设厅网站/百度推广登录平台怎么收费
  • 建设工程的招标网站有哪些/网址怎么创建
  • 商洛网站建设哪家好/网络舆情处置的五个步骤
  • 网站建设公司行业描述填什么/小程序制作
  • 赣州的免费网站建设/百家号权重查询站长工具
  • 南安住房与城乡建设部网站/网络营销有什么岗位
  • 成都网站建设推广服务/营销渠道的概念
  • 如何建设黔货出山电子商务网站/厦门排名推广
  • 山东兴宇建设工程网站/怎么有自己的网站
  • 航天桥网站建设/山西seo关键词优化软件搜索
  • 网站建设费用初步预算/自建站
  • 深圳 商城 网站建设/百度广告投诉电话客服24小时
  • 校园网站建设管理制度/网络搜索关键词排名
  • 建设公司网站 优帮云/企业网站推广优化公司
  • 高新区网站建设的建议/花生壳免费域名注册
  • 平面磨床东莞网站建设/打广告的免费软件
  • 个人网站备案建设方案书/站长工具排行榜
  • 城乡建设部网站造价工程师查询/站长之家收录查询
  • 视觉营销网站建设规划分析/百度ai人工智能平台
  • 上海建溧建设集团有限公司网站/智能建站网站模板
  • 本地集团网站建设/常见的推广方式有哪些
  • 衡东网站建设/网络优化论文
  • 建设工程质量监督站网站/营销型网站建设题库
  • 南通科技网站建设/google浏览器下载安装
  • 礼仪策划网站建设/网址搜索引擎入口
  • 黄岛区建设局网站/河南公司网站建设
  • 县政府网站建设实施方案/西安seo培训学校
  • 大连建设局网站/摘抄一小段新闻