ClickHouse读书笔记(一)—ClickHouse的前世今生
2022/3/8 6:16:45
本文主要是介绍ClickHouse读书笔记(一)—ClickHouse的前世今生,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
第一章的内容是ClickHouse的诞生背景,相比其他数据库的优缺点。读此书时,我对一些数据库的概念没有认知,很容易被卡住,讲着讲着就不知道是在讲什么,特此,记录一些概念性的东西。
1、名词
- BI系统:商业智能系统,Business Intelligence。
- OLAP:联机分析处理,On-Line Analytical Processing。是数据仓库系统的主要应用,支持复杂的分析操作,侧重决策支持,并且提供直观易懂的查询结果。 强调数据分析,强调SQL执行市场,强调磁盘I/O,强调分区等。
- OLTP:联机事务处理,On-Line Transaction Processing。是传统的关系型数据库的主要应用,主要是基本的、日常的事务处理,例如银行交易。强调数据库内存效率,强调内存各种指标的命令率,强调绑定变量,强调并发操作。
- 数据立方体:通过对数据进行预处理,空间换时间,提升查询性能。
- ROLAP:Relational OLAP,关系型OLAP,直接使用关系模型构建,可以转换为SQL查询,粗暴理解为好多个group by之类的操作。
- MOLAP:Multidimensional OLAP,多维型OLAP。缓解ROLAP的性能问题,以空间换时间,类似索引预处理。
- HOLAP:Hybrid OLAP,混合架构的OLAP。ROLAP+MOLAP。
- Hadoop:大数据生态,有三个核心组件分别是是分布式存储、运算、调度。
- RAID(Redundant Arrays of Independent Drives)是磁盘阵列,是由很多价格较便宜的磁盘,组合成一个容量巨大的磁盘组,利用个别磁盘提供数据所产生加成效果提升整个磁盘系统效能。利用这项技术,将数据切割成许多区段,分别存放在各个硬盘上。
- IOPS:Input/Output Operations Per Second,每秒读写次数。
- SSD:Solid State Drives,固态硬盘。
- ClickHouse:全称Click Stream,Data WareHouse,点击流数据仓库。
2、ClickHouse不适用的场景
ClickHouse是高性能的OLAP数据库,不应该用于OLTP事务性操作的场景,有以下不足:
- 不支持事物
- 不擅长根据主键按行粒度进行查询(虽然支持),故不应该把ClickHouse当作Key-Value数据库使用。
- 不擅长按行删除数据库(虽然支持)
这篇关于ClickHouse读书笔记(一)—ClickHouse的前世今生的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-05-09flutter3.x_macos桌面os实战
- 2024-05-09Rust中的并发性:Sync 和 Send Traits
- 2024-05-08使用Ollama和OpenWebUI在CPU上玩转Meta Llama3-8B
- 2024-05-08完工标准(DoD)与验收条件(AC)究竟有什么不同?
- 2024-05-084万 star 的 NocoDB 在 sealos 上一键起,轻松把数据库编程智能表格
- 2024-05-08Mac 版Stable Diffusion WebUI的安装
- 2024-05-08解锁CodeGeeX智能问答中3项独有的隐藏技能
- 2024-05-08RAG算法优化+新增代码仓库支持,CodeGeeX的@repo功能效果提升
- 2024-05-08代码报错不用愁,CodeGeeX一键完成代码修复、错误解释的功能上线了!
- 2024-05-08今天开始程序员不用再发愁写commit message了,全部由CodeGeeX自动完成!