花费 7 ms
Spark MLlib 机器学习

本章导读 机器学习(machine learning, ML)是一门涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多领域的交叉学科。ML专注于研究计算机模拟或实现人类的学习行为,以获取新知识、 ...

Thu Aug 16 01:39:00 CST 2018 1 19678
Spark SQL基本概念与基本用法

1. Spark SQL概述 1.1 什么是Spark SQL Spark SQL是Spark用来处理结构化数据的一个模块,它提供了两个编程抽象分别叫做DataFrame和DataSet,它们用于 ...

Sat May 12 11:04:00 CST 2018 0 14980
Spark环境搭建(下)——Spark安装

1. 下载Spark 1.1 官网下载Spark http://spark.apache.org/downloads.html 打开上述链接,进入到下图,点击红框下载Spark-2.2.0-b ...

Mon Nov 27 23:45:00 CST 2017 0 9289
MapReduce Shuffle 和 Spark Shuffle 原理概述

Shuffle简介 Shuffle的本意是洗牌、混洗的意思,把一组有规则的数据尽量打乱成无规则的数据。而在MapReduce中,Shuffle更像是洗牌的逆过程,指的是将map端的无规则输出按指定的 ...

Fri May 10 23:34:00 CST 2019 0 2270
Spark开发常用参数

Driver spark.driver.cores driver端分配的核数,默认为1,thriftserver是启动thriftserver服务的机器,资源充足的话可以尽量给多。 spark. ...

Fri Sep 27 21:08:00 CST 2019 0 1522
大数据风控系统概述

为什么要做风控系统 不做的话,会有以下风险: 各种小号、垃圾账号泛滥 撞库攻击、盗号、毁号、拖库等 拉新 10w 留存率不到 5% 百万营销费用,却增加不了用户粘性 投票票数 ...

Sun Jan 19 18:13:00 CST 2020 0 2759
Spark Streaming编程指南

Overview A Quick Example Basic Concepts Linking Initializing StreamingContext ...

Sat Feb 10 00:05:00 CST 2018 0 3317
Spark Streaming任务延迟监控及告警

概述 StreamingListener 是针对spark streaming的各个阶段的事件监听机制。 StreamingListener接口 自定义StreamingListener ...

Fri Nov 01 22:42:00 CST 2019 0 1017
Spark源码解析 - Spark-shell浅析

1.准备工作 1.1 安装spark,并配置spark-env.sh 使用spark-shell前需要安装spark,详情可以参考http://www.cnblogs.com/swordfall/ ...

Sat Jul 07 02:08:00 CST 2018 0 2570

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM