原文:面试:谈谈你对大数据的理解

大数据概念: 大数据 big data :指无法在一定时间范围内用常规软件工具进行捕捉 管理和处理的数据集合, 是需要新处理模式才能具有更强的决策力 洞察发现力和流程优化能力的海量 高增长率和多样化的信息资产。 主要解决:海量数据的存储和海量数据的分析计算问题。 大数据的 V特性: Volume 大量 :数据体量巨大,PB级 gt EB级 gt ZB级 Velocity 高速 :数据输入输出的速度 ...

2018-12-07 00:15 0 4879 推荐指数:

查看详情

谈谈我对大数据的看法

1.大数据的由来 之所以会出现大数据,主要是由于我们进入了信息时代,随着进入了信息时代,各种信息激增,包括金融,交通,电商,网上的各种信息,这些信息都是各有用处的,有待挖掘;像我自己是处于金融行业的技术人员,我们建立了一个小型的数仓平台,每天都会从上交所和深交所中获取各种交易性的数据,这些信息 ...

Sun Aug 23 04:44:00 CST 2020 0 638
什么是大数据(个人理解

1、什么是大数据? 基本概念 在互联网技术发展到现今阶段,大量日常、工作等事务产生的数据都已经信息化,人类产生的数据量相比以前有了爆炸式的增长,以前的传统的数据处理技术已经无法胜任,需求催生技术,一套用来处理海量数据的软件工具应运而生,这就是大数据! 换个角度说,大数据是: 1、有海量 ...

Thu Jan 03 17:42:00 CST 2019 0 1044
对于大数据理解

一、 大数据基本概念 大数据Big Data是指大小超出了常用的软件工具在运行时间内可以承受的收集,管理和处理数据能力的数据集;大数据是目前存储模式与能力、计算模式与能力不能满足存储与处理现有数据集规模产生的相对概念。 大数据的预处理 主要完成对已接收数据的辨析、抽取、清洗等操作 ...

Wed Mar 02 23:54:00 CST 2016 0 4737
大数据面试总结

大数据基础部分面试题: 一.你了解Hadoop吗?讲一下Hadoop中HDFS的读写原理。 读: 客户端调用FileSystem的open方法,来打开希望读取的文件。 FileSystem通过Rpc与namenode通信,namenode将获取到的信息整理,并将文件的所有内容发送给 ...

Tue Apr 16 04:01:00 CST 2019 0 580
大数据面试总结(一)

一、如何检查namenode是否正常运行?重启namenode的命令是什么?  通过节点信息和浏览器查看,通过脚本监控  hadoop-daemon.sh start namenode  hdfs-d ...

Sun Aug 25 20:39:00 CST 2019 0 6259
大数据面试题总结

面试题总结: 分布式文件系统(Distributed File System)是指文件系统管理的物理存储资源不一定直接连接在本地节点上,而是通过计算机网络与节点相连。分布式文件系统的设计基于客户机/服务器模式。 [优点] 支持超大文件 超大文件在这里指的是几百M,几百GB,甚至几TB大小 ...

Wed Nov 22 18:34:00 CST 2017 0 3933
大数据面试

判断题: 1.如果 NameNode 意外终止,SecondaryNameNode 会接替它使集群继续工作。(错误)   分析:  SecondaryNameNode是帮助恢复,而不是替代 S ...

Sat Sep 15 00:34:00 CST 2018 0 1189
苏宁大数据面试

1. hadoop 使用什么版本,CDH版本号,是5.3.6 。hadoop的版本是2.72,记住cdh的版本号和hadoop版本号不一样。2. flume是单节点采集数据还是多节点采集数据?flume是自定义框架还是用官方提供的框架?官方框架开发中有什么问题 ...

Sun Jun 16 21:13:00 CST 2019 0 515
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM