当前位置: 首页 > news >正文

访问域名/seo网络推广专员招聘

访问域名,seo网络推广专员招聘,哈尔滨建设局网站,wordpress用多大主机原始文件、合并后的文件:拆分后的小文件:实例演示:将一个大Excel等份拆成多个Excel将多个小Excel合并成一个大Excel并标记来源work_dir"./course_datas/c15_excel_split_merge"splits_dirf"{work_dir}/splits"import osi…

原始文件、合并后的文件:

2155b81de3cd310757f9e84a0c95822d.png

拆分后的小文件:

5e84bdd05c680eb44ef19cf60e6e2b84.png

实例演示:

  1. 将一个大Excel等份拆成多个Excel

  2. 将多个小Excel合并成一个大Excel并标记来源

work_dir="./course_datas/c15_excel_split_merge"
splits_dir=f"{work_dir}/splits"

import os
if not os.path.exists(splits_dir):
    os.mkdir(splits_dir)

0、读取源Excel到Pandas

import pandas as pd
df_source = pd.read_excel(f"{work_dir}/crazyant_blog_articles_source.xlsx")
df_source.head()
idtitletags
02585Tensorflow怎样接收变长列表特征python,tensorflow,特征工程
12583Pandas实现数据的合并concatpandas,python,数据分析
22574Pandas的Index索引有什么用途?pandas,python,数据分析
32564机器学习常用数据集大全python,机器学习
42561一个数据科学家的修炼路径数据分析
df_source.index
RangeIndex(start=0, stop=258, step=1)
df_source.shape
(258, 3)
total_row_count = df_source.shape[0]
total_row_count
258

一、将一个大Excel等份拆成多个Excel

  1. 使用df.iloc方法,将一个大的dataframe,拆分成多个小dataframe

  2. 将使用dataframe.to_excel保存每个小Excel

1、计算拆分后的每个excel的行数

# 这个大excel,会拆分给这几个人
user_names = ["xiao_shuai", "xiao_wang", "xiao_ming", "xiao_lei", "xiao_bo", "xiao_hong"]
# 每个人的任务数目
split_size = total_row_count // len(user_names)
if total_row_count % len(user_names) != 0:
    split_size += 1

split_size
43

2、拆分成多个dataframe

df_subs = []
for idx, user_name in enumerate(user_names):
    # iloc的开始索引
    begin = idx*split_size
    # iloc的结束索引
    end = begin+split_size
    # 实现df按照iloc拆分
    df_sub = df_source.iloc[begin:end]
    # 将每个子df存入列表
    df_subs.append((idx, user_name, df_sub))

3、将每个datafame存入excel

for idx, user_name, df_sub in df_subs:
    file_name = f"{splits_dir}/crazyant_blog_articles_{idx}_{user_name}.xlsx"
    df_sub.to_excel(file_name, index=False)

二、合并多个小Excel到一个大Excel

  1. 遍历文件夹,得到要合并的Excel文件列表

  2. 分别读取到dataframe,给每个df添加一列用于标记来源

  3. 使用pd.concat进行df批量合并

  4. 将合并后的dataframe输出到excel

1. 遍历文件夹,得到要合并的Excel名称列表

import os
excel_names = []
for excel_name in os.listdir(splits_dir):
    excel_names.append(excel_name)
excel_names
['crazyant_blog_articles_0_xiao_shuai.xlsx',
 'crazyant_blog_articles_1_xiao_wang.xlsx',
 'crazyant_blog_articles_2_xiao_ming.xlsx',
 'crazyant_blog_articles_3_xiao_lei.xlsx',
 'crazyant_blog_articles_4_xiao_bo.xlsx',
 'crazyant_blog_articles_5_xiao_hong.xlsx']

2. 分别读取到dataframe

df_list = []

for excel_name in excel_names:
    # 读取每个excel到df
    excel_path = f"{splits_dir}/{excel_name}"
    df_split = pd.read_excel(excel_path)
    # 得到username
    username = excel_name.replace("crazyant_blog_articles_", "").replace(".xlsx", "")[2:]
    print(excel_name, username)
    # 给每个df添加1列,即用户名字
    df_split["username"] = username

    df_list.append(df_split)
crazyant_blog_articles_0_xiao_shuai.xlsx xiao_shuai
crazyant_blog_articles_1_xiao_wang.xlsx xiao_wang
crazyant_blog_articles_2_xiao_ming.xlsx xiao_ming
crazyant_blog_articles_3_xiao_lei.xlsx xiao_lei
crazyant_blog_articles_4_xiao_bo.xlsx xiao_bo
crazyant_blog_articles_5_xiao_hong.xlsx xiao_hong

3. 使用pd.concat进行合并

df_merged = pd.concat(df_list)
df_merged.shape
(258, 4)
df_merged.head()
idtitletagsusername
02585Tensorflow怎样接收变长列表特征python,tensorflow,特征工程xiao_shuai
12583Pandas实现数据的合并concatpandas,python,数据分析xiao_shuai
22574Pandas的Index索引有什么用途?pandas,python,数据分析xiao_shuai
32564机器学习常用数据集大全python,机器学习xiao_shuai
42561一个数据科学家的修炼路径数据分析xiao_shuai
df_merged["username"].value_counts()
xiao_hong     43
xiao_bo       43
xiao_shuai    43
xiao_lei      43
xiao_wang     43
xiao_ming     43
Name: username, dtype: int64

4. 将合并后的dataframe输出到excel

df_merged.to_excel(f"{work_dir}/crazyant_blog_articles_merged.xlsx", index=False)

cbcd7c91f69d39a3fd695a079d602f9e.png

http://www.jmfq.cn/news/5083237.html

相关文章:

  • 动态网站开发实训心得/谷歌google下载安卓版 app
  • 做网站一般注意些什么/怎样优化标题关键词
  • 漯河网做网站/seo关键词排名优化如何
  • 做网站 怎么做留言/十堰seo优化
  • 想要注册一个公司网站怎么做/网址提交入口
  • 党刊网站怎么做/怎么去推广自己的平台
  • 北京通州做网站/谷歌搜索引擎优化
  • 新网站该如何做网站优化呢/模板建站优点
  • 网站被降权了怎么办/西安企业seo
  • wordpress 登陆后查看/seo优化外包
  • 顺德网站建设收费标准/万网域名官网
  • 公司网站建设费/游戏代理推广渠道
  • 南昌网站建设过程/东莞做网站推广公司
  • 个人做门户网站/百度软件中心官网
  • 微商怎么引流推广/厦门百度seo公司
  • 企业网站建设与实现的论文/百度seo技术优化
  • 做网站不推广/个人网站seo
  • 二手房网签合同在哪个网站做/广州网络营销
  • 宣城做网站公司/宁波seo网络推广产品服务
  • 网站开发需要数据库技术/关键词seo公司
  • 商城网站建设公司/搜索百度网页版
  • 想学设计怎么入门在家自己学/重庆关键词seo排名
  • 云南做网站价格/品牌营销策略有哪些
  • 网站推广是做什/石家庄头条今日头条新闻
  • 建设学院网站的通知书/产品推广策略
  • 广告行业网站建设方案/广告营销案例分析
  • 烟台网站制作策划/营销型网站设计制作
  • 海外代购网站怎么做/常见的网站推广方式
  • 河北高端网站建设/运营是做什么的
  • 如何做公众号小说网站赚钱/直通车怎么开