当前位置: 首页 > news >正文

外语教学网站开发/sem和seo哪个工作好

外语教学网站开发,sem和seo哪个工作好,网站代理网站,文创产品设计公司背景 今天用spark sql运行一个insert into 一张分区表table的语句,发现运行完之后hdfs路径没有体现出来分区的特点,而是显示像这样: hdfs:/xxx/part-02000-ed511ebe-b44e-4531-ae6d-18a170b30451-c000.snappy.parquet而如果用hive sql插入分区表的话&a…

背景

今天用spark sql运行一个insert into 一张分区表table的语句,发现运行完之后hdfs路径没有体现出来分区的特点,而是显示像这样:

hdfs:/xxx/part-02000-ed511ebe-b44e-4531-ae6d-18a170b30451-c000.snappy.parquet

而如果用hive sql插入分区表的话,其路径是这样的:

hdfs:/xxx/dt=20210427

查表显示

虽然spark sql和hive sql写入表之后的hdfs文件路径形式不一样,但是查表的时候,都是可以正常显示每一个分区的的;通过show partitions tables:

partition
dt=20210501
dt=20210502
dt=20210503
dt=20210504
dt=20210505
dt=20210506
dt=20210507
...

原因分析

误导1:其实spark的那个保存路径事overwrite之后的非分区文件,之所以差对应的表仍有多个分区,是因为这个表之前是有那么多分区的,可以重新刷新一下这个表的路径指定,这样每次跑出来的表就不再是一个分区表;

总结

spark sql保存文件还是遵循相应的像hive的路径那样的规则,如果出现路径跟table查出来的分区情况不一致(比如:本省spark sql插入的是一张非分区表,而 table显示有多个分区,则需要爸表重新刷新一下,比如refresh table,或者更建议的方式是先把之前的分区文件移到别的目录,再重新运行spark sql跑数据,就可以看到实际的文件存储效果了)

参考

1)https://support.huaweicloud.com/sqlref-spark-dli/dli_08_0095.html

2)https://spark.apache.org/docs/latest/sql-data-sources-hive-tables.html

http://www.jmfq.cn/news/5144149.html

相关文章:

  • 做网站用需要几个软件/合肥网络公司seo建站
  • 长沙市政府网/网站优化包括哪些
  • 乾安网站建设哪家好/优质网站
  • 石家庄哪里有做网站/安卓排名优化
  • 昆山做网站找文博/seo网站结构优化的方法
  • 中国做外贸网站有哪些问题/怎么创建一个属于自己的网站
  • 专门做视频的网站/百度竞价代运营外包
  • 重庆忠县网站建设公司/北京网络推广外包公司排行
  • 蓝色网站模板/最新seo新手教程
  • 怎样做展会推广网站/宁波网站建设优化企业
  • 百度网站查反链/百度推广营销
  • 网站背景 手机显示不全/seo网站推广推荐
  • wordpress关闭手机访问/百度seoo优化软件
  • 增城网站建设/容易被百度收录的网站
  • 做网站师傅/seo用什么论坛引流
  • 杭州网站建设出 名/seo公司培训课程
  • 互联网网站界面设计 要素/企业网站seo贵不贵
  • 用asp做的几个大网站/怎么弄一个自己的网址
  • 一个网站是如何建设/适合小学生的新闻事件
  • 四川建设厅官方网站是多少/新东方烹饪学校学费一年多少钱
  • 制作个人网站教程/某网站搜索引擎优化
  • 六安市人民政府/seo优化就业前景
  • 网站防止被采集/怎么做好营销推广
  • 小语种网站开发/西安企业seo
  • 做网站前途如何/互联网推广招聘
  • 上海服装集团网站建设/哈尔滨网络seo公司
  • 有哪些网站可以做店面设计/企业营销案例
  • 公司网站工程案例怎么做/下载安装
  • adobe网站制作/人大常委会委员长
  • 政府 网站建设规划/全媒体广告投放平台