原文:Apache Spark 2.2.0 中文文檔 - SparkR (R on Spark) | ApacheCN

SparkR R on Spark 概述 SparkDataFrame 啟動: SparkSession 從 RStudio 來啟動 創建 SparkDataFrames 從本地的 data frames 來創建 SparkDataFrames 從 Data Sources 數據源 創建 SparkDataFrame 從 Hive tables 來創建 SparkDataFrame SparkD ...

2017-09-26 19:29 0 1257 推薦指數:

查看詳情

Apache Storm 1.1.0 中文文檔 | ApacheCN

前言 Apache Storm 是一個免費的,開源的,分布式的實時計算系統. 官方文檔: http://storm.apache.org 中文文檔: http://storm.apachecn.org ApacheCN 最近組織了翻譯 Storm 1.1.0 中文文檔 的活動,整體 翻譯進度 ...

Mon Aug 28 22:51:00 CST 2017 7 584
Kafka 中文文檔 - ApacheCN

Kafka 中文文檔 - ApacheCN https://kafka.apachecn.org/ https://kafka.apachecn.org/intro.html Apache Kafka® 是 一個分布式流處理平台. 這到底意味着什么呢? 我們知道流處理平台有以下 ...

Sat Aug 29 00:48:00 CST 2020 0 502
Apache Spark技術實戰之5 -- SparkR的安裝及使用

歡迎轉載,轉載請注明出處,徽滬一郎。 概要 根據論壇上的信息,在Sparkrelease計划中,在Spark 1.3中有將SparkR納入到發行版的可能。本文就提前展示一下如何安裝及使用SparkR. SparkR的出現解決了R語言中無法級聯擴展的難題,同時也極大的豐富了Spark在機器學習 ...

Mon Sep 29 05:18:00 CST 2014 0 4776
Spark 2.2.0 文檔中文Spark Programming Guide 編程指南

  綜述:   在高層中,每個spark應用由一個運行用戶主函數的driver program和執行各種集群上的parallel operations所組成。spark最主要的概念:RDD彈性分布式數據集,它是一個跨越“可並行操作集群”所有節點的基本分區的集合。RDDs可被多種方式創建 ...

Wed Jul 19 22:53:00 CST 2017 2 3221
Spark 2.2.0 文檔中文版 Collaborative Filtering 協同過濾 JAVA推薦系統

  協同過濾常用於推薦系統,這項技術旨在填補 丟失的user-item關聯矩陣 的條目,spark.ml目前支持基於模型的協同過濾(用一些丟失條目的潛在因素在描述用戶和產品)。spark.ml使用ALS(交替最小二乘法)去學習這些潛在因素。在spark.ml中的實現有以下參數 ...

Thu Jul 20 00:30:00 CST 2017 0 2192
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM