当前位置：首页 > news >正文

外语教学网站开发/sem和seo哪个工作好

news 2025/6/30 18:11:20

外语教学网站开发,sem和seo哪个工作好,网站代理网站,文创产品设计公司背景今天用spark sql运行一个insert into 一张分区表table的语句，发现运行完之后hdfs路径没有体现出来分区的特点,而是显示像这样： hdfs:/xxx/part-02000-ed511ebe-b44e-4531-ae6d-18a170b30451-c000.snappy.parquet而如果用hive sql插入分区表的话&a…

背景

今天用spark sql运行一个insert into 一张分区表table的语句，发现运行完之后hdfs路径没有体现出来分区的特点,而是显示像这样：

hdfs:/xxx/part-02000-ed511ebe-b44e-4531-ae6d-18a170b30451-c000.snappy.parquet

而如果用hive sql插入分区表的话，其路径是这样的：

hdfs:/xxx/dt=20210427

查表显示

虽然spark sql和hive sql写入表之后的hdfs文件路径形式不一样，但是查表的时候，都是可以正常显示每一个分区的的；通过show partitions tables：

partition
dt=20210501
dt=20210502
dt=20210503
dt=20210504
dt=20210505
dt=20210506
dt=20210507
...

原因分析

误导1:其实spark的那个保存路径事overwrite之后的非分区文件，之所以差对应的表仍有多个分区，是因为这个表之前是有那么多分区的，可以重新刷新一下这个表的路径指定，这样每次跑出来的表就不再是一个分区表；

总结

spark sql保存文件还是遵循相应的像hive的路径那样的规则，如果出现路径跟table查出来的分区情况不一致（比如：本省spark sql插入的是一张非分区表，而 table显示有多个分区，则需要爸表重新刷新一下，比如refresh table，或者更建议的方式是先把之前的分区文件移到别的目录，再重新运行spark sql跑数据，就可以看到实际的文件存储效果了）

参考

1）https://support.huaweicloud.com/sqlref-spark-dli/dli_08_0095.html

2）https://spark.apache.org/docs/latest/sql-data-sources-hive-tables.html

http://www.jmfq.cn/news/5144149.html

相关文章：

做网站用需要几个软件/合肥网络公司seo建站

长沙市政府网/网站优化包括哪些

乾安网站建设哪家好/优质网站

石家庄哪里有做网站/安卓排名优化

昆山做网站找文博/seo网站结构优化的方法

中国做外贸网站有哪些问题/怎么创建一个属于自己的网站

专门做视频的网站/百度竞价代运营外包

重庆忠县网站建设公司/北京网络推广外包公司排行

蓝色网站模板/最新seo新手教程

怎样做展会推广网站/宁波网站建设优化企业

百度网站查反链/百度推广营销

网站背景手机显示不全/seo网站推广推荐

wordpress关闭手机访问/百度seoo优化软件

增城网站建设/容易被百度收录的网站

做网站师傅/seo用什么论坛引流

杭州网站建设出名/seo公司培训课程

互联网网站界面设计要素/企业网站seo贵不贵

用asp做的几个大网站/怎么弄一个自己的网址

一个网站是如何建设/适合小学生的新闻事件

四川建设厅官方网站是多少/新东方烹饪学校学费一年多少钱

制作个人网站教程/某网站搜索引擎优化

六安市人民政府/seo优化就业前景

网站防止被采集/怎么做好营销推广

小语种网站开发/西安企业seo

做网站前途如何/互联网推广招聘

上海服装集团网站建设/哈尔滨网络seo公司

有哪些网站可以做店面设计/企业营销案例

公司网站工程案例怎么做/下载安装

adobe网站制作/人大常委会委员长

政府网站建设规划/全媒体广告投放平台