第五篇 大数据基本介绍
2021/7/15 23:17:07
本文主要是介绍第五篇 大数据基本介绍,对大家解决编程问题具有一定的参考价值,需要的程序猿们随着小编来一起学习吧!
目录
- 大数据特性
- 大数据带来的问题和解决方案
- 大数据都能做什么
- 大数据相关组件
大数据特性
- 数据量大
一切皆数据,所能看到的一切基本都可以转化为数据。海量数据呈指数级别上升。 - 数据多样
视频、图片、语音、文本、格式化数据、xml、各式各样数据…. - 数据告诉传播
2g、3g、4g、5g每秒几GB的传输速度,使得数据交互越来越快 - 数据中的价值
大量的价值潜在在数据当中,比如常见的广告推荐、用户画像、行为检测等
大数据带来的问题和解决方案
-
海量的数据如何存储
分布式存储多台机器,如:HDFS、ODPS、AWS -
海量的数据如何计算
分布式计算MapReduce -
在极其脏乱的数据中挖掘有价值的数据
机器学习、深度学习算法
大数据都能做什么
大数据相关组件
协同过滤
- 协同过滤概念
协同过滤由:相似性和过滤掉点击过或评价过的物品组成 - 协同分为:用户协同过滤和物料协同过滤
这篇关于第五篇 大数据基本介绍的文章就介绍到这儿,希望我们推荐的文章对大家有所帮助,也希望大家多多支持为之网!
- 2024-05-08见鬼了!我家的 WiFi 只有下雨天才能正常使用...
- 2024-05-081名工程师轻松管理20个工作流,创业企业用Serverless 让数据处理流程提效
- 2024-05-08如何从架构层面降低公有云多可用区同时故障的概率
- 2024-05-08网络隔离的最小配置
- 2024-05-08云原生周刊:Terraform 1.8 发布 | 2024.5.6
- 2024-05-08开源电子邮件营销平台 listmonk 使用教程
- 2024-04-07答网友24个有关DBA课程的问题
- 2024-04-07夯实智慧新能源数据底座,TiDB Serverless 在 Sandisolar+ 的应用实践
- 2024-03-2303-Spark SQL入门
- 2024-03-16离线数仓建设之数据导出