《大数据的一个重要方面:数据可用性》笔记
2022/3/7 23:46:33
本文主要是介绍《大数据的一个重要方面:数据可用性》笔记,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
1.大数据可用性的概念、挑战和研究问题
1.1 大数据可用性的基本概念
- 一致性
- 精确性
- 完整性:数据集合中包含足够的数据来回答各种查询和支持各种计算
- 时效性
- 实体同一性:同一实体在各种数据源中的描述统一
1.2 大数据可用性的挑战和研究问题
- 高质量大数据获取与整合的理论和技术
- 完整的大数据可用性理论体系
- 数据错误自动检测与修复的理论和技术
- 弱可用数据上近似计算的理论和技术
弱可用数据:数据中的错误不能彻底修复
- 弱可用数据上的知识发掘与演化的机理
2.数据可用性的研究进展
2.1 高质量大数据获取与整合
大数据的主要来源:
1. 分布在Web上的丰富数据库资源
2. 物理信息系统,如智能电网、智慧城市等
3. 科学实验与观测数据
这篇关于《大数据的一个重要方面:数据可用性》笔记的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-04-07答网友24个有关DBA课程的问题
- 2024-04-07夯实智慧新能源数据底座,TiDB Serverless 在 Sandisolar+ 的应用实践
- 2024-03-2303-Spark SQL入门
- 2024-03-16离线数仓建设之数据导出
- 2024-03-15数仓开发之ODS层
- 2024-03-11tsv文件在大数据技术栈里的应用场景
- 2024-03-10hive分区和分桶你熟悉吗?
- 2024-03-03内含资料下载丨黄东旭:2024 现代应用开发关键趋势——降低成本、简化架构
- 2024-02-23Runaway Queries 管理:提升 TiDB 稳定性的智能引擎
- 2024-02-23数据价值在线化丨TiDB 在企查查数据中台的应用及 v7.1 版本升级体验