当前位置: 首页 > news >正文

wordpress添加分类图片/安徽百度seo教程

wordpress添加分类图片,安徽百度seo教程,嘉兴做外贸网站比较好的公司,网站推广方案及预算当你使用Spark对hive表进行Overwrite的时候,基本流程是删除metastore的表信息,删除数据,写_temp目录,移动_temp目录数据,最后写入表信息(我描述的这个流程不一定完全对,熟悉hive的大大欢迎指正&…

当你使用Spark对hive表进行Overwrite的时候,基本流程是删除metastore的表信息,删除数据,写_temp目录,移动_temp目录数据,最后写入表信息(我描述的这个流程不一定完全对,熟悉hive的大大欢迎指正)。这个过程可能很漫长,比如我们就遇到了当时spark进程正在写_temp目录数据,结果就这个时候Spark被异常杀死。当Spark进程启动后再次尝试时,就会报错:

Can not create the managed table('`test`.`test`'). 
The associated location('hdfs://....') already exists.;

原因就是新进程发现还有_temp目录,以为有另外的进程正在写,所以就拒绝写了。对于定时任务,这会是个很大的问题,因为即使进行重试,也没有效果,除非你手动删除该目录

当然,这个问题并不大,最大的问题是,整个过程Hive表都无法正常对外提供服务了。我相信如果大家看完了我前面关于Delta Lake的篇章,应该自己能脑补为什么不会存在上面的问题。不过我这里还是聊一聊Delta Lake为什么不存在Hive的问题。

首先Delta Lake是有版本支持的,而且新数据写入(包括覆盖写),都不会影响原来的版本(我们先假设overwrite之前的最新版本是10),这意味着,Delta在进行overwrite操作时,他会先写新数据,把所有的准备工作做好,这个过程,所有的reader都读版本10的数据,读操作不会受到影响。接着,耗时的准备工作做好了,delta才会开始进行commit操作,也就是把这次新增的数据文件以及那些要标记删除的数据文件都记录下来,形成一个新的版本,这个过程是有原子性的,要么成功,要么失败,不会partial状态。所以commit失败了(比如没commit或者commit期间程序异常被杀),那么依然不影响读。当程序再次启动运行的时候,程序看到的依然是老版本10,这个时候他会重新进行之前的覆盖操作。

你可能会问,如果事变了,那那些准备好的数据在哪呢,不会被读取么?答案是他们变成了孤儿数据,相当于没有指针再指向了(Delta Log里没有他们的记录),可以回收掉了。Delta会在合适的时候自动收拾掉这些数据,或者你调用vacuum去手动清楚。

http://www.jmfq.cn/news/5047651.html

相关文章:

  • 哪家网络么司做网站好/沈阳网站seo公司
  • 做分析仪器推广的网站/友情链接交换教程
  • wordpress做社交网站吗/软件推广
  • 简约网站版式/项目推广渠道有哪些
  • 青岛网站设计公司电话/优化网站关键词排名软件
  • 齐齐哈尔做网站的公司/外贸seo软文发布平台
  • 哈尔滨网站建设唯辛ls15227/宁波网站推广方式怎么样
  • 网站建设与开发/网站seo网络优化
  • 联想网站建设摘要/个人网页设计制作网站模板
  • 网站的底部导航怎么做/网站关键词优化
  • 如何搭建网站建设环境/拉新推广
  • 固始做网站的公司/如何建立一个自己的网站
  • 做网站的规范/seo优化软件哪个好
  • 昆明建站专家/新乡seo网络推广费用
  • wordpress自动保存图片/seo接单一个月能赚多少钱
  • 上海网站设计哪家好/建立网站有哪些步骤
  • 设计一份企业网络的组网方案/seo是搜索引擎吗
  • 公司网页如何建立/seo顾问阿亮
  • 江苏省建设工程一站式申报网站/seo咨询服务
  • 网站 linux 服务器配置/seo的工具有哪些
  • 网站阴影/电商平台运营方案思路
  • 廊坊网站建/短视频剪辑培训班速成
  • 武汉专业做网站的公司/天津网站快速排名提升
  • 网站空间费/优化防控举措
  • 长沙百度网站优化/发布软文网站
  • 企业的做网站/b2b免费推广网站
  • 山东淄博疫情最新消息/化工seo顾问
  • 不申请域名可以 做网站吗/百度app下载官方免费下载安装
  • 金华seo建站/排名怎么优化快
  • 做色视频在线观看网站/网络推广渠道都有哪些