花费 22 ms
Spark机器学习之推荐引擎

一. 最小二乘法建立模型 关于最小二乘法矩阵分解,我们可以参阅: 一、矩阵分解模型。 用户对物品的打分行为可以表示成一个评分矩阵A(m*n),表示m个用户对n各物品的打 ...

Wed Jun 08 22:50:00 CST 2016 3 10384
Clickhouse 入门

clickhouse 简介 ck是一个列式存储的数据库,其针对的场景是OLAP。OLAP的特点是: 数据不经常写,即便写也是批量写。不像OLTP是一条一条写 大多数是读请求 查询并发较 ...

Tue Dec 01 06:47:00 CST 2020 0 1540
pyspark中union和union all

spark中union 和 unionAll看起来相似,但是实际上操作上结果上都有区别。union会把数据都扫一遍,然后剔除重复的数据;然而unionAll直接把两份数据粘贴返回,时间上会快很多。 ...

Thu May 28 18:53:00 CST 2020 1 2256
SQL引擎(查询引擎和存储引擎)

sql引擎(我觉得仅仅是查询引擎)主流包含: HIve,Impala,spark sql,Drill,HAWQ和Presto 还有2大商业化的选择: Oracle Big Data SQL和IBM的 ...

Thu May 21 01:15:00 CST 2020 0 1912
Hive架构及搭建方式

目录 前言 hive的基础知识 基本架构 metastore 内嵌服务和数据库 内嵌服务 服务和数据 ...

Sat Oct 23 23:52:00 CST 2021 0 245

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM