用户
 找回密码
 立即注册
搜索

47

主题

49

帖子

875

积分

高级会员

Rank: 4

积分
875
发表于 2017-5-17 17:08:33
1f8d00040fb3ccf5599a.jpg


什么是大数据?

大数据(big data),是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。或许对很多人来说这样的概念还是太抽象了,为了更好的理解什么是大数据,我们从以下几个关键词来切入更形象的对大数据做一个界定。

首先,大数据“规模大”,这种规模可以从两个维度来衡量,一是从时间序列累积大量的数据。

二是,在深度上更加细化的数据。 其次,大数据“多样化”,可以是不同的数据格式,如文字、图片、视频等,可以是不同的数据类别,如人口数据,经济数据等,还可以有不同的数据来源,如互联网、传感器等。

第三,大数据“动态化”。数据是不停地变化的,可以随着时间快速增加大量数据,也可以是在空间上不断移动变化的数据。

什么是Hadoop?

Hadoop是一个开发和运行处理大规模数据的软件平台,是Appach的一个用java语言实现开源软件框架,实现在大量计算机组成的集群中对海量数据进行分布式计算。

Hadoop实现了一个分布式文件系统(Hadoop Distributed File System),简称HDFS。HDFS有高容错性的特点,并且设计用来部署在低廉的(low-cost)硬件上;而且它提供高吞吐量(high throughput)来访问应用程序的数据,适合那些有着超大数据集(large data set)的应用程序。HDFS放宽了(relax)POSIX的要求,可以以流的形式访问(streaming access)文件系统中的数据。

为什么说学习大数据必须学Hadoop?

刚刚我们已经分析了什么是大数据,也明白了什么是Hadoop,为什么说学习大数据必须学Hadoop呢?大数据就是大量的海量的数据,面对这些海量数据传统的数据存储方式已经无法满足需求,而Hadoop技术完美的解决了这个问题,用最简单最直接最明了的句子来说的话就是:Hadoop解决了大数据如何存储的问题!

现在国内很多大数据培训机构打着大数据培训的幌子却做着不专业的事情,光环大数据陪机构严正提醒各位想学习大数据的同学:行业真正大数据,82%主讲都是hadoop、spark生态体系、storm实时开发。市面所谓“大数据”机构85%基本讲的都是JAVA/PHP数据或数据库学习(大数据课程含量不超过15%),初学者请务必认清你要学的是不是真正大数据!


使用道具 举报 回复
发表于 2017-5-22 15:43:25
能让大家受益,真不错,为楼主点赞!
使用道具 举报 回复 支持 反对
发表于 2017-5-22 15:43:35
呵呵,看大家评论如何
使用道具 举报 回复 支持 反对
发表于 2017-5-22 16:51:13
看了,感觉不错
使用道具 举报 回复 支持 反对
发表于 2017-5-22 18:00:45
说的好,一定要回复~
使用道具 举报 回复 支持 反对
发表于 2017-5-27 15:26:37
朋友不错,谢谢您的努力,顶了
使用道具 举报 回复 支持 反对
请楼主继续发好贴,支持你
使用道具 举报 回复 支持 反对
发表于 2017-6-12 19:29:12
回不回呢,考虑再三,还是不回了吧
使用道具 举报 回复 支持 反对
发表于 2017-6-19 14:27:35
做个记号,下次好找!
使用道具 举报 回复 支持 反对
看的人少,回一下
使用道具 举报 回复 支持 反对
1234下一页
发新帖