当前位置: 首页 > news >正文

浙江省一建建设集团网站/新冠咳嗽怎么办

浙江省一建建设集团网站,新冠咳嗽怎么办,室内设计师网上培训班,上海网站建设 方案概述 两种模式 Spark on Hive: 语法是Spark SQL语法,实际上是在IDEA上编写java叠加SQL的代码。 Hive on Spark: 只是替换了Hadoop的MR,改为了Spark的计算引擎。 发展历史 RDD > DataFrame > DataSet: 都有惰性机制,遇…

概述

两种模式

Spark on Hive: 语法是Spark SQL语法,实际上是在IDEA上编写java叠加SQL的代码。

Hive on Spark: 只是替换了Hadoop的MR,改为了Spark的计算引擎。

发展历史

RDD => DataFrame => DataSet:

  1. 都有惰性机制,遇到行动算子才会执行。
  2. 三者都会根据Spark的内存情况自动缓存运算
  3. 三者都有分区的概念

特点

  1. 易整合:无缝的整合了SQL查询和Spark编程
  2. 统一的数据访问方式:使用相同的方式连接不同的数据源
  3. 兼容Hive:在已有的仓库上直接运行SQL或者HQL
  4. 标准的数据连接:通过JDBC或者ODBC来连接

数据的加载和保存

json文件:spark数据读取时,读取后会自动解析JSON,并且附加上列名和属性类型。并且兼容RDD的算子操作,

public class SQL_Test {public static void main(String[] args) {SparkConf sparkConf = new SparkConf().setAppName("SparkSQL").setMaster("local[*]");SparkSession spark = SparkSession.builder().config(sparkConf).getOrCreate();DataFrameReader read = spark.read();//读取后会自动解析JSON,并且附加上列名和属性类型Dataset<Row> userJSON = read.json("input/user.json");//打印数据类型userJSON.printSchema();userJSON.show();//即收集又打印spark.close();}
}

自定义函数

UDF操作单个数据,产生单个数据

import org.apache.spark.SparkConf;
import org.apache.spark.sql.*;
import org.apache.spark.sql.api.java.UDF2;
import org.apache.spark.sql.types.DataTypes;

/**

  • title:

  • @Author 浪拍岸

  • @Create 19/10/2023 上午8:52

  • @Version 1.0
    /
    public class SQL_UDF {
    public static void main(String[] args) {
    SparkConf sparkConf = new SparkConf().setAppName(“SparkSQL”).setMaster("local[
    ]");
    SparkSession spark = SparkSession.builder().config(sparkConf).getOrCreate();

     DataFrameReader read = spark.read();//读取后会自动解析JSON,并且附加上列名和属性类型Dataset<Row> userJSON = read.json("input/user.json");userJSON.createOrReplaceTempView("t1");//注册函数spark.udf().register("myudf", new UDF2<String, Long, String>() {@Overridepublic String call(String s, Long integer) throws Exception {if(integer >= 18){return s+"大侠";}else{return s+"小虾米";}//return null;}}, DataTypes.StringType);//spark.sql("select myudf(name,age) from t1").show();spark.close();
    

    }
    }

UDAF操作多个数据,产生单个数据

import org.apache.spark.SparkConf;
import org.apache.spark.sql.*;
import org.apache.spark.sql.api.java.UDF2;
import org.apache.spark.sql.types.DataTypes;
import static org.apache.spark.sql.functions.udaf;public class SQL_UDAF {public static void main(String[] args) {SparkConf sparkConf = new SparkConf().setAppName("SparkSQL").setMaster("local[*]");SparkSession spark = SparkSession.builder().config(sparkConf).getOrCreate();DataFrameReader read = spark.read();//读取后会自动解析JSON,并且附加上列名和属性类型Dataset<Row> userJSON = read.json("input/user.json");userJSON.createOrReplaceTempView("t1");//注册函数spark.udf().register("ageAVG", udaf(new AgeAvg(), Encoders.LONG()));//spark.sql("select name,ageAVG(age) from t1 group by name").show();spark.close();}
}

文件的读取和转换保存

  1. json格式
  2. csv格式
  3. parquet、orc格式

Hive交互

  1. 开启Hive支持enableHiveSupport()
  2. 用户权限造假System.setProperty("HADOOP_USER_NAME","atguigu");
  3. 添加hive-site.xml到resource目录下
import org.apache.spark.SparkConf;
import org.apache.spark.sql.SparkSession;/*** title:** @Author 浪拍岸* @Create 19/10/2023 下午3:35* @Version 1.0*/
public class HiveTest {public static void main(String[] args) {System.setProperty("HADOOP_USER_NAME","atguigu");SparkConf sparkConf = new SparkConf().setAppName("SparkSQL").setMaster("local[*]");SparkSession spark = SparkSession.builder().enableHiveSupport().config(sparkConf).getOrCreate();//        spark.sql("show tables").show();spark.sql("select * from stu where id = 1").createOrReplaceTempView("t1");spark.sql("select * from t1").show();spark.close();}
}
http://www.jmfq.cn/news/5332699.html

相关文章:

  • seo网站建设规划/精准客户运营推广
  • 江苏大才建设集团网站/重庆疫情最新数据
  • 绵阳市建设工程监督网站/网络推广关键词优化公司
  • 惠州网站建设公司/baidu 百度一下
  • 易企秀 旗下 网站建设/广州网站建设工作室
  • 财经直播网站建设/网站排名前十
  • 花卉网站建设规划书/网站案例分析
  • 企业电子商务网站建设策划书/福州短视频seo
  • 网站建设 嘉定/百度站长收录
  • 福建建设职业管理中心网站/广州seo外包
  • 建设学校网站需要具备/seo搜索铺文章
  • 学习网站建设需要什么/苏州seo怎么做
  • 虹口广州网站建设/百度趋势搜索
  • 杭州网站建设代理商/流量平台有哪些
  • 易经网站建设应用/关键词如何确定
  • 衡州网站建设seo/常见的网站推广方式
  • 建设项目竣工验收网站/百度官方推广
  • 商城类网站建设数据库/短视频seo
  • 深圳北站网站建设/steam交易链接在哪里
  • 上海宝山网站建设培训/百度电脑版入口
  • 春哥技术团队网站建设/谷歌浏览器下载手机版安卓官网
  • 网站建设可视化工具/免费网络推广平台
  • 延安市城乡建设局网站/今日广东头条新闻
  • 枣庄网站建设哪家公司好/爱站网seo
  • 高校二级学院网站建设管理制度/目前引流最好的app
  • 安徽网站建设公司排名/google官网入口
  • 小蚁人网站建设/关键词排名优化工具
  • 网站建设技术外文/百度站长平台电脑版
  • 网站建设什么是开发实施实施/网站权重查询工具
  • 学校网站建设招标方案/网站策划书的撰写流程