
大数据与云计算是什么关系?二者市场发展怎么样?
大数据:
指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。
大数据领域的人才需求主要围绕大数据的产业链展开,涉及到数据的采集、整理、存储、安全、分析、呈现和应用,岗位多集中在大数据平台研发、大数据应用开发、大数据分析和大数据运维等几个岗位。
大数据本身除了要有数据、采集、汇聚一定量的数据之外,更重要的是数据的处理、挖掘、分析、可视化、应用这样一整套的过程。关于大数据的话题,基本围绕三个问题展开:一是数据从哪里来,二是数据如何进行分析,三是数据如何进行商品化。
云计算:
是基于互联网的相关服务的增加、使用和交付模式,通常涉及通过互联网来提供动态易扩展且经常是虚拟化的资源。
云计算的应用目前正在经历从IaaS向PaaS和SaaS发展,在用户分布上也逐渐开始从互联网企业向广大传统企业过渡,未来的市场空间还是非常大的。
二者关系:
大数据和云计算各有不同的关注点,但是在技术体系结构上,都是以分布式存储和分布式计算为基础,所以二者之间的联系也比较紧密。
从技术上看,大数据与云计算的关系就像一枚硬币的正反面一样密不可分。大数据必然无法用单台的计算机进行处理,必须采用分布式架构。它的特色在于对海量数据进行分布式数据挖掘。但它必须依托云计算的分布式处理、分布式数据库和云存储、虚拟化技术。
从应用角度来看,大数据是云计算的应用案例之一,云计算是大数据的实现工具之一。
云计算相当于我们的计算机和操作系统,将大量的硬件资源虚拟化之后再进行分配使用,在云计算领域目前的老大应该算是Amazon,可以说为云计算提供了商业化的标准,另外值得关注的还有VMware(其实从这一点可以帮助你理解云计算和虚拟化的关系),开源的云平台较有活力的就是Openstack了。
大数据相当于海量数据的“数据库”,而且通观大数据领域的发展也能看出,当前的大数据处理一直在向着近似于传统数据库体验的方向发展,Hadoop的产生使我们能够用普通机器建立稳定的处理TB级数据的集群,把传统而昂贵的并行计算等概念一下就拉到了我们的面前,但是其不适合数据分析人员使用(因为MapReduce开发复杂),所以PigLatin和Hive出现了(分别是Yahoo!和facebook发起的项目,说到这补充一下,在大数据领域Google、facebook、twitter等前沿的互联网公司作出了很积极和强大的贡献),为我们带来了类SQL的操作,到这里操作方式像SQL了,但是处理效率很慢,绝对和传统的数据库的处理效率有天壤之别,所以人们又在想怎样在大数据处理上不只是操作方式类SQL,而处理速度也能“类SQL”,Google为我们带来了Dremel/PowerDrill等技术,Cloudera(Hadoop商业化较强的公司,Hadoop之父cutting就在这里负责技术领导)的Impala也出现了。
大数据与云计算前景:
当前整个IT行业对于大数据和云计算人才的需求量还是比较大的,近几年相关方向研究生的就业情况还是比较不错的,一方面岗位级别比较高,另一方面薪资待遇也比较可观,而且薪资待遇正呈现出逐年上升的发展趋势。