当前位置: 首页 > news >正文

天津和平做网站/网络营销咨询公司

天津和平做网站,网络营销咨询公司,做设计到哪个网站赚钱,江苏中南建筑信息平台2021年广东省专业技能大赛——大数据技术与应用 真题题目及解析 文章适合用户了解大数据技能大赛的考试提纲和解析步骤。文章在编写过程中难免有疏漏和错误,欢迎大佬指出文章的不足之处;更多内容请点进👉 Lino_White 👈查看。 未来…

2021年广东省专业技能大赛——大数据技术与应用 真题题目及解析

文章适合用户了解大数据技能大赛的考试提纲和解析步骤。文章在编写过程中难免有疏漏和错误,欢迎大佬指出文章的不足之处;更多内容请点进👉 Lino_White 👈查看。
未来的世界充满着各式各样的数据,我们该怎么好好利用起来呢?开启正文吧~~~

提纲

比赛题目分为5点进行,3人一组,可以根据组员情况进行分配任务。
常见分组情况为任务一二一人、任务三一人、任务四五一人。

1. 组件部署
2. 数据爬虫
3. 数据清洗及分析
4. 数据可视化
5. 编写报告

.
.
.

比赛考点

任务一 组件部署

主要考察Hadoop HA高可用,Hive两点。

任务二 数据爬虫

主要考察scrapy框架使用,以及selenium模拟操作。

任务三 数据清洗及分析

主要考察spark core的运用。
注意:spark 截止目前未涉及DataFrame、DataSet、Streaming

任务四 数据可视化

主要考察falsk框架,jinja语法。

任务五 编写报告

主要考察你的文学底蕴。
.
.
.

真题技术点解析

比赛题目均用绝对路径

  • 任务一 组件部署
    1.将master节点指定目录下的JDK包解压到/usr/local/src,将命令复制粘贴至报告。
    2.设置JDK环境变量,并使环境变量只对当前用户生效,将配置内容复制粘贴至报告。
    3.配置SSH免密钥登陆,实现master到slave1免密登录,将命令和结果复制粘贴至报告。
    4.配置Zookeeper,在Hadoop HA下启动并查看进程状态,将命令和结果复制粘贴至报告。
    4.查看进程,将命令和结果复制粘贴至报告。
  • 任务二 数据爬虫
    1-4.填充函数,填充代码,将完整函数复制粘贴至报告
    5.对数据进行简单的重复值统计/缺失值统计,将代码和结果复制粘贴至报告。
  • 任务三 数据清洗及分析(25分)
    1.1 数据清洗
    (1)去除首行,对字段数异常的进行过滤(字段值数量正常为61),对两个字段中时间字段进行格式,如字段中存在(2020/1/10 22:10:12、2020-1-2 14:05:55),如果字段未空则不进行相关处理,转换成统计格式:yyyy-MM-dd,并分别统计修改的个数是多少,结果输出如下:

******************* 创建时间字段 修改144条数异常值**************************
******************* 签订时间字段 修改167条数异常值**************************
******************* 剩余条数:18933**************************

(2)将其结果打包输出至/hotelsparktask1,并且运行,将命令和结果复制粘贴至报告。
(3)查看/hotelsparktask1中的文件,输出前10行数据,将命令和结果复制粘贴至报告。
1.2 数据清洗
(1)利用/hotelsparktask1中的数据对创建时间字段和签订时间字段同时不为空的行值,统计求出相差中位数,相差中位数单位为天,输出如下格式:

******************* 相差中位数的天数为 114**************************

(2)对签订时间字段为空的,利用相差中位数和创建时间字段相关公式,填充正确的签订时间,(公式:签订时间=创建时间+相差中位数)并且输出如下格式:

******************* 填充相差中位数:1134条**************************

(3)将结果输出至/hotelsparktask2下,并利用管道命令查看前10行数据,将命令和结果复制粘贴值报告

2.1 数据分析
.
.

  • 任务四 数据可视化
    .
    .
    .
  • 任务五 编写报告
    .
    .
    .

更多内容请查看下一章:《2021年广东省专业技能大赛——大数据技术与应用 真题题目及解析(2)》

这里先给出部分题目,剩余题目、答案和解析步骤,请具体请查看下一章

http://www.jmfq.cn/news/5029453.html

相关文章:

  • 美女做丝袜广告视频网站/百度权重什么意思
  • 微网站怎样做/百度推广营销
  • 做网站建设挣钱吗/百度营销大学
  • 劫持网站权重/保定网站建设公司哪家好
  • 自己有域名怎么做网站/搜索引擎推广方案案例
  • 无锡网站制作选哪家/惠州seo排名收费
  • ftp怎么做网站/网络推广营销公司
  • 徐州招聘网站哪个好/seo的培训课程
  • 免费网站空间论坛/社群营销方案
  • 高端网站开发培训价格/想找搜索引擎优化
  • 世界新闻网是什么网站/怎么样建网站
  • 正规网站优化公司/整站优化和关键词优化的区别
  • wordpress备份文章/seo站长网怎么下载
  • 免费小程序模板/windows优化大师要钱
  • 抖音网络工作室/宁波seo在线优化哪家好
  • 制作网站需要用什么软件/谷歌关键词搜索工具
  • 开源saas多用户建站系统/全网引流推广
  • 建设个网站需要什么/线上推广策划方案范文
  • 公司做网站 微信平台/推广app
  • 阳光保险官方网站/制作网页链接
  • 做教育网站挣钱/网络推广怎么赚钱
  • 管理咨询公司项目运作流程图/宁波企业seo服务
  • 遵义做网站公司/上海seo有哪些公司
  • 中国数据域名注册/点金推广优化公司
  • wordpress 活动网站/北京网络推广
  • 网站电线电话图怎么做/网络销售网站
  • 找人做菠菜网站需要多少钱/汕头网站建设优化
  • 湛江网站制作系统/长春网站建设模板
  • 做网站的人多吗/首页
  • 阿里巴巴网站如何做免费推广/seo项目经理