【Spark機器學習速成寶典】基礎篇01Windows下spark開發環境搭建（Scala版）

本文轉載自查看原文 2017-12-16 18:00 1215 0020.Spark機器學習/ 機器學習/ 大數據/ 環境搭建

package com.itmorn.ml
import org.apache.spark.{SparkContext, SparkConf}
object wordCount {
  def main(args: Array[String]) {
    val conf = new SparkConf().setMaster("local").setAppName("wordCount")    //創建環境變量
    val sc = new SparkContext(conf)                                //創建環境變量實例
    val data = sc.textFile("data/wc.txt")                                //讀取文件
    data.flatMap(_.split(" ")).map((_, 1)).reduceByKey(_+_).collect().foreach(println)    //word計數
  }
}

import org.apache.spark.sql.SparkSession
import org.apache.log4j.{Level, Logger}
object xgboostTest {
  Logger.getLogger("org").setLevel(Level.ERROR)
  def main(args: Array[String]): Unit = {
    val spark = SparkSession
      .builder()
      .master("local")
      .appName("SparkSessionZipsExample")
      .enableHiveSupport()
      .getOrCreate()

    val line = spark.sparkContext.textFile("wc")

    line.flatMap(_.split(" ")).map((_, 1)).reduceByKey(_+_).collect().foreach(println)

  }
}

返回目錄

條目7

　　。

返回目錄

條目8

　　。

返回目錄

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

【Spark機器學習速成寶典】基礎篇01Windows下spark開發環境搭建（Scala版）

目錄

安裝jdk

安裝Scala IDE for Eclipse

配置Spark

配置Hadoop

創建Maven工程

Scala代碼

條目7

條目8

條目9

免責聲明！