【文章推荐】可靠的、可扩展的、可维护的数据系统 ------《Designing Data-Intensive Applications》读书笔记1

原文：可靠的、可扩展的、可维护的数据系统 ------《Designing Data-Intensive Applications》读书笔记1

坦白说也是机缘巧合，在硕士生阶段进入分布式系统领域学习。无论是大规模存储或计算，其核心也是运用分布式技术利用并行性来解决数据密集型应用的需求。最近开始在啃这本 Designing Data Intensive Applications 大部头，作者Martin Kleppmann在分布式数据系统领域有着很深的功底，并在这本书中完整的梳理各类纷繁复杂设计背后的技术逻辑，不同架构之间的妥协与超越，很 ...

2017-12-07 11:53 0 3760 推荐指数：

查看详情

存储与索引------《Designing Data-Intensive Applications》读书笔记3

在上一篇的笔记之中，我们讨论了数据模型和查询语言。在第三章之中我们来聊一聊不同的数据引擎内部是如何实现存储和检索的，以及不同设计之间的折中与妥协。 1.键值对数据库键值对数据库是数据库形式之中最简单的一种模式，我们可以把它简化的实现为下面两个函数：底层存储格式也十分简单：一个 ...

数据模型与查询语言 ------《Designing Data-Intensive Applications》读书笔记2

数据模型是开发软件的最重要的部分，因为它们对应用程序有着深远的影响：不仅是软件的编写方式，而且也影响我们如何解决的问题的方式。第二篇读书笔记，我们聊一聊数据模型的设计。 1.数据模型的分层作为一个开发者来说，在一个复杂的应用程序中，是存在很多分层模型的，但基本思想还是一样的：每一层 ...

流处理与消息队列------《Designing Data-Intensive Applications》读书笔记16

上一篇聊了聊批处理的缺点，对于无界数据来说，流处理会是更好的选择，“流”指的是随着时间的推移逐步增加的数据。消息队列可以将这些流组织起来，快速的在应用程序中给予反馈。但是消息队列与传统的数据库之间又存在着“剪不断，理还乱”的“纠葛”，最后我们将探讨通过消息队列之中与时序有关的一些问题 ...

MapReduce与批处理------《Designing Data-Intensive Applications》读书笔记14

之前的文章大量的内容在和大家探讨分布式存储，接下来的章节进入了分布式计算领域。坦白说，个人之前专业的重心侧重于存储，对许多计算的内容理解可能不是和确切，如果文章中的理解有所不妥，愿虚心赐教。本篇将和大家聊一聊分布式计算的一个子集：批处理。批处理系统通常也叫脱机系统，需要大量的输入数据 ...

Designing Data-Intensive Applications

下面是这本书序言中的大部分内容，本人的英文水平有限，有理解不到位的地方还请大家指教，这算是自己对这本书的读书笔记和总结。数据是当今系统设计中许多挑战的中心，一些难以解决的问题如系统的可扩展性，一致性，可靠性，有效性和可维护性等需要弄清楚。另外，面对这些琳琅满目的工具包括关系型数据 ...

线性一致性与全序广播------《Designing Data-Intensive Applications》读书笔记12

基于分布式系统的线性一致性。 1.更强的一致性大多数分布式数据库至少提供了最终一致性，这意味着如果停止对 ...

Designing Data-Intensive Applications

相对于读书笔记，本文更像是一篇阅读大纲，在初步阅读本书后，尚有许多疑难，借用此大纲，以后温故而知新 DDIA讲了什么什么是data-intensive 原文这样定义 Data-intensive applications are pushing the boundaries ...

推荐系统读书笔记(二)利用用户行为数据

2.1 用户行为数据简介　　显性反馈行为：用户明确表示对物品喜好的行为。评分、喜欢、不喜欢。　　隐性反馈行为：不能明确反应用户喜好的行为。比如页面浏览。显性反馈数据隐性反馈数据用户兴趣明确 ...

原文：可靠的、可扩展的、可维护的数据系统 ------《Designing Data-Intensive Applications》读书笔记1

相关推荐

相关标签