hdfs是什么?


参考:https://www.cnblogs.com/shijiaoyun/p/5778025.html

hadoop分布式文件系统

1、hdfs是一个分布式文件系统,简单理解就是多台机器组成的一个文件系统。

 

2、hdfs中有3个重要的模块,client对外提供统一操作接口,DataNode真正存储数据,NameNode协调和管理数据,是一个典型的master-slave架构。

 

3、hdfs会对大文件进行切块,并且每个切块会存储备份,保证数据的高可用,适合存储大数据。

 

4、NameNode通过fsimage和editlog来实现数据恢复和高可用。

 

5、hdfs不适用于大量小文件存储,不支持并发写入,不支持文件随机修改,查询效率大概在秒级。


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM