当前位置: 首页 > news >正文

石家庄知名网站建设/企业推广公司

石家庄知名网站建设,企业推广公司,手机怎么建立自己网站,wordpress 文章 函数想将一份 pdf 论文中的所有参考文献都提取出来,去掉不必要的换行,放入一个 text 文件,方便复制。其引用是 ieee 格式的,形如: 想要只在引用序号(如 [3])前换行,其它换行都去掉&…

想将一份 pdf 论文中的所有参考文献都提取出来,去掉不必要的换行,放入一个 text 文件,方便复制。其引用是 ieee 格式的,形如:
ieee-ref
想要只在引用序号(如 [3])前换行,其它换行都去掉,即一行一条参考文献。

可用 pypdf[1],其主页有示例,加上 re 去除非序号前的换行(检测 [)。

Code

from pypdf import PdfReader
import re# 检测非 `[` 前的换行
pattern = r'\n(?!\[)'reader = PdfReader("paper.pdf")
n_pages = len(reader.pages)
print(n_pages)with open("ref.txt", "w", encoding="utf-8") as f:for i in range(23, 29): # 自己确定 reference 页码范围page = reader.pages[i]text = page.extract_text()text = re.sub(r'-\n', '', text) # hyphen 后换行:连 hyphen 一齐删text = re.sub(pattern, ' ', text) # 多余换行换成空格f.write(text)# + '\n')

References

  1. py-pdf/pypdf
http://www.jmfq.cn/news/5347567.html

相关文章:

  • 政府门户网站建设情况简介/江门seo外包公司
  • 外贸企业网站建设公司价格/最新旅游热点
  • 网站建设汇报/今日头条收录入口
  • 网站建设 乐达云创/百度关键词优化培训
  • 小米网站建设项目书/seo关键词分类
  • 网站建设需要会什么软件/电商代运营
  • 渭南市网站建设/网络培训班
  • 余杭区高端网站建设/郑州seo优化外包
  • 网站建设丶金手指a排名15/sem代运营
  • 建设网站对公司起什么作用/网推公司干什么的
  • 网站建设方案书0/搜索引擎广告投放
  • 加快公司网站建设/电商平台怎么注册
  • 组织网站建设应该注意什么/百度网站优化方案
  • 广东建设工程中标公示网站/网络推广项目
  • 专注律师微网站建设与律师微信营销6/seo优化是什么意思
  • 企业完善网站建设/怎样做好竞价推广
  • 建站魔方极速网站建设/营销技巧培训ppt
  • 乐都企业网站建设哪家好/网站多少钱
  • 四川人防工程建设网站/百度一下手机版
  • 网站建设后台有哪些东西/小吴seo博客
  • 宜春市住房和城乡建设局网站/小学生收集的新闻10条
  • 潍坊网站建设选聚搜网络好/百度官方网站首页
  • 徐州集团网站建设公司/临沂森工木业有限公司
  • 漳州网站建设哪家好/公司广告推广方案
  • 建设一个小网站需要多少钱/seo外包
  • 道路建设网站/seo单页面优化
  • 网站建设经费预算包括哪些/网站推广计划书
  • 常州网络公司鼎豪网络网站建设/舆情监测系统
  • No酒店网站建设/南宁百度seo公司
  • 零基础网站建设教学培训/淘宝店铺运营推广