大数据-irpas技术客-第9页

Hive 如何进行权限控制_程序遠_hive权限控制

目前hive支持简单的权限管理，默认情况下是不开启，这样所有的用户都具有相同的权限，同时也是超级管理员，也就对hive中的所有表都有查看和改动的......

大数据网络 2221 02-07

hive 日期和时间戳互相转化_大数据界的扛把子_hive时间戳转换日期格式

一 . 日期转时间戳 1 unix_timestamp()???获取当前时间戳 ?select unix_timestamp(); --1636462239 ?2 unix_timestamp() ?输入日期参数? 输入的时间格式必须符合 yyyy-MM-d......

大数据 irpas 3715 02-07

实践数据湖iceberg 第八课 hive与iceberg集成_星星之火_hive iceberg

系列文章目录实践数据湖iceberg 第一课入门实践数据湖iceberg 第二课 iceberg基于hadoop的底层数据格式实践数据湖iceberg 第三课在sqlclient中，以sql方式从kaf......

大数据 irpas 6665 02-07

Hive的安装和使用以及Java操作hive_CSDN专家-微编程_hive java

Hive 引言简介 hive是facebook开源，并捐献给了apache组织，作为apache组织的顶级项目(hive.apache.org)。 hive是一个基于大数据技术的数据仓库(DataWareHous......

大数据网络 3963 02-07

读取hive表中的数据进行数据可视化_大太阳花花公主_hive数据可视化

目录 1，目的 2，hive中的操作 2.1创建数据库 2.2，建表并导入数据 2.3，提取需要的数据 2.4，创建新的表并导入上一步所得数据 3，开......

大数据 irpas 5470 02-07

hadoop介绍_昊昊该干饭了

目录大数据与Hadoop Hadoop模块： Hadoop Common： Hadoop 分布式文件系统 (HDFS)： Hadoop YARN： Hadoop MapReduce： Hadoop生态圈组件&......

大数据网络 2697 02-07

Ubuntu下搭建伪分布式从0开始安装Hive详细教程（从JDK安装、Hadoop搭建开始）_跳舞的皮埃尔_hive伪分布式搭建

Ubuntu下搭建伪分布式从0开始安装Hive详细教程（从JDK安装、Hadoop搭建开始）环境：VMware? Workstation 16 Pro、Ubuntu18.04 1、安装SSH和配置SSH无密......

大数据大大的周 5185 02-07

SparkSQL知识点总结_默主归沙_spark sql 总结

一、SparkSql的概述 1.1 SparkSql是什么 1. SparkSql 是Spark生态体系中的一个基于SparkCore的SQL处理模块 2. 用途是处理具有结构化的数据文件的 3. 前身叫Shark，由......

大数据大大的周 2786 02-07

Hudi 集成 Hive_雾岛与鲸_hive hudi

环境: hudi 0.10.1 spark 2.4.5 hive 2.3.7 hadoop 2.7.5 将编译好的hudi jar, copy到hive lib目录下: cp /Users/xxx/cloudera/lib/hudi/packaging/hudi-hadoop-mr-bundle/......

大数据未知 5589 02-07

Flink详述双流 Join 3 种解决方案 + 2 种优化方案_pekingK_flink双流join数据延迟

1.前言这一期的面试题主要是介绍 Flink 面试中的高频面试题，Flink 流 Join 相关内容，相信大家在面试中遇到的太多了，本节包含的主要内容如下：......

大数据大大的周 3787 02-07

Hive/Presto中函数grouping sets用法详解（踩坑总结，看到赚到）_LdyLLLLLLLD_grouping sets函数

目录 1. 问题讨论1.1 数据准备1.2 问题描述1.3 其它方法多维度聚合（union、with cube） 2. Hive中的grouping sets函数2.1 grouping sets方法多维度聚合2.2 gr......

大数据网络投稿 5723 02-07

FlinkCDC的2.2.0版本怎么监控库中的所有表，增加新表到已有任务？_薛定谔的猫不吃猫粮

FlinkCDC的2.2.0版本怎么监控库中的所有表，增加新表到已有任务？一、监控全表 ? 千呼万唤始出来，之前预告FlinkCDC的2.2.0支持Flink1.14和添加新表,满......

大数据网络投稿 2107 02-07

小文件治理之hive文件合并：hive小文件合并的三种方法_星星之火_hive 数据合并

文章目录前言一、concatenate方法二、insert overwrite方法三、insert overwrite select * 用法总结前言 hive分区下，有很多小文件，例如一个分区有1000个文......

大数据网络 812 02-07

Hive Metastore详解大全_一个数据小开发_hive metastore

1、介绍 Hive所有表和分区的元数据都通过Hive Metastore进行访问。使用JPOX ORM解决方案(Data Nucleus)持久化元数据，因此它支持的任何数据库都可以被Hive使用。它支......

大数据 irpas 3040 02-07

Hive中collect_list()排序问题详解_<一蓑烟雨任平生>_collectlist顺序乱的原因

来看一道互联网公司的面试题：有个用户好友表：字段如下 uid fans_uid score 返回：uid, fans_uid_list【fans_uid的拼接串，按照score降序拼接】......

大数据未知 4168 02-07

基于Hadoop的项目实战-职位数据综合分析_小崔的金箍棒_hadoop项目实战

?一、数据采集（selenium） from selenium import webdriver import time import re import pandas as pd import os ?在爬取的过程中可能会有登陆弹窗，......

大数据 irpas 5872 02-07

Hive自定义UDF函数详解_banbanmaster_hive udf函数编写

Hive自定义UDF函数详解一、UDF概述二、UDF种类三、如何自定义UDF四、自定义实现UDF和UDTF4.1 需求4.2 项目pom文件4.3 Hive建表测试及数据4.4 UDF函数编写4.5 UDTF函数编写......

大数据大大的周 4288 02-07

hive insert、select组合动态插入分区表_张三。。_hive insert into select

使用waterdrop操作hive的时候遇到一个问题，按照sql的insert、select组合插入应该使用下面的语句： INSERT INTO table t_ads_gsddy_jzfdl_day SELECT a.senid ......

大数据大大的周 6568 02-07

hivesql -- array_contains()函数使用_扫地增_array_contains

array_contains函数解析 Hive中的array_contains函数与SQL中的 in关键字操作类似，用于判定包含（array_contains）或不包含（!array_contains&#......

大数据大大的周 5042 02-07

Hive调优及参数优化（详细版）_奇迹虎虎_hive调优与参数设置

1 Hive参数优化 1.1 Hive基础配置 1.1.1 HiveServer2 的 Java 堆栈 Hiveserver2异常退出，导致连接失败的问题。解决方法：修改HiveServer2 的 Java 堆栈大小。......

大数据大大的周 1065 02-07