HIve SQL学习笔记
2021/4/9 2:25:16
本文主要是介绍HIve SQL学习笔记,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
HIve SQL学习笔记
最近面试的时候一直听到面试官说Hive SQL,今天刷了一点资料稍微系统的学习一下,在这里做一个小结。
首先介绍一下Hive SQL:
- Hive是基于Hadoop的一个数据仓库工具,可以将结构化的数据文件映射为一张数据库表,并提供完整的SQL查询功能,可以将SQL语句转换为MapReduce任务运行。它使得针对Hadoop进行SQL查询成为可能。简单来说,Hive
SQL与我们之前见到的MySQL等关系型数据库的语法是差不多的。
Hive SQL 与 SQL的区别:
- 1.HQL不支持行级别的增、改、删,所有数据在加载时就已经确定,不可更改
- 2.不支持事务
- 3.支持分区存储
- 4.查询速度响应不如SQL迅速
Hive SQL需要注意的地方:
- 1.Hive SQL不支持top函数,在Hive SQL中找前几的话可以使用limit函数
- 2.执行顺序的与mySQL一致
- 3.日常处理中需要注意map数不要过万
Hive SQL在业务上:
- 1.Hive SQL专用函数 from_unixtime()、datediff()、date_add()、date_sub()
- 2.Hive SQL独有的窗口函数使用起来效率更高
- 3.union all 使用速度要比full join 速度更快,一般常使用unoin all +数字0占位来实现full join的功能;同时union all常搭配coalesce()函使用
- 4.业务中如果出现:存在某某表但不存在某某表当中时,考虑使用left join查询效率更高
- 5.当需要查询数据的前百分之多少数据时,考虑采用ntile()函数
学习参考资料:
- https://www.bilibili.com/video/BV1uy4y1m7mf
- 《Hive编程指南》
这篇关于HIve SQL学习笔记的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-05-15鸿蒙生态设备数量超8亿台
- 2024-05-13TiDB + ES:转转业财系统亿级数据存储优化实践
- 2024-05-09“2024鸿蒙零基础快速实战-仿抖音App开发(ArkTS版)”实战课程已上线
- 2024-05-09聊聊如何通过arthas-tunnel-server来远程管理所有需要arthas监控的应用
- 2024-05-09log4j2这么配就对了
- 2024-05-09nginx修改Content-Type
- 2024-05-09Redis多数据源,看这篇就够了
- 2024-05-09Google Chrome驱动程序 124.0.6367.62(正式版本)去哪下载?
- 2024-05-09有没有大佬知道这种数据应该怎么抓取呀?
- 2024-05-09这种运行结果里的10.100000001,怎么能最快改成10.1?