花费 21 ms
Ceph BlueStore 解析:Object IO到磁盘的映射

作者:吴香伟 发表于 2017/02/19 版权声明:可以任意转载,转载时务必以超链接形式标明文章原始出处和作者信息以及版权声明 简单回顾下Ceph OSD后端存储引擎的历史。 为解决事务原子 ...

Mon Feb 20 04:06:00 CST 2017 0 6009
Kudu vs HBase

本文由 网易云 发布。 背景 Cloudera在2016年发布了新型的分布式存储系统——kudu,kudu目前也是apache下面的开源项目。Hadoop生态圈中的技术繁多,H ...

Thu May 10 00:01:00 CST 2018 0 2973
如何有效恢复误删的HDFS文件

HDFS是大数据领域比较知名的分布式存储系统,作为大数据相关从业人员,每天处理HDFS上的文件数据是常规操作。这就容易带来一个问题,实际操作中对重要数据文件的误删,那么如何恢复这些文件,就显得尤为重要 ...

Tue Dec 01 17:03:00 CST 2020 0 1261
Jerasure库简介及使用范例

刚刚写这篇文章之前看了下上一篇博客的时间:2013年7月19日。居然已经过了3个月了!好快!感叹时间的同时不由的又感叹了下自己的懒惰,其实仔细想想,这段时间自己也做了很多事情: 完成了一篇副本 ...

Sun Oct 13 04:39:00 CST 2013 6 6479
HBase高级特性、rowkey设计以及热点问题处理

在阐述HBase高级特性和热点问题处理前,首先回顾一下HBase的特点:分布式、列存储、支持实时读写、存储的数据类型都是字节数组byte[],主要用来处理结构化和半结构化数据,底层数据存储基于hdfs ...

Wed Nov 25 17:11:00 CST 2020 0 729
必须掌握的分布式文件存储系统—HDFS

HDFS(Hadoop Distributed File System)分布式文件存储系统,主要为各类分布式计算框架如Spark、MapReduce等提供海量数据存储服务,同时HBase、Hive底层 ...

Tue Oct 27 17:11:00 CST 2020 0 764
gfs分布式文件系统

1、介绍 gfs是构建在廉价服务器之上的大型分布式文件系统。 设计原则: gfs组件失效是常态事件,而不是意外事件。gfs构建在普通商业PC之上,这些PC的稳定性并没有很高的保障, ...

Sun Apr 22 23:30:00 CST 2018 0 1532
一步一步安装配置Ceph分布式存储集群

Ceph可以说是当今最流行的分布式存储系统了,本文记录一下安装和配置Ceph的详细步骤。 提前配置工作 从第一个集群节点开始的,然后逐渐加入其它的节点。对于Ceph,我们加入的第一个节点应该是Mo ...

Thu Feb 06 21:23:00 CST 2020 0 998
拆开Ceph看队列和线程

作者:吴香伟 发表于 2017/01/08 版权声明:可以任意转载,转载时务必以超链接形式标明文章原始出处和作者信息以及版权声明 我上小学时家离学校很远,家在某某山脚,学校在镇里。每周回家一趟, ...

Sat Feb 11 06:00:00 CST 2017 0 1802
Hive Join优化

在阐述Hive Join具体的优化方法之前,首先看一下Hive Join的几个重要特点,在实际使用时也可以利用下列特点做相应优化: 1. 只支持等值连接 2. 底层会将写的HQL语句转换为MapR ...

Thu Nov 12 17:09:00 CST 2020 0 432

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM