原文:【大數據應用技術】作業十二|Hadoop綜合大作業

本次作業的要求來自:https: edu.cnblogs.com campus gzcc GZCC SE homework 前言 本次作業是在 爬蟲大作業 的基礎上進行的,在 爬蟲大作業 中,我主要對拉勾網python崗位的招聘信息進行的數據爬取,最終得到了 條數據存在一個名為lagoupy.xls中。本次作業的任務主要有以下三點: .對CSV文件進行預處理生成無標題文本文件,將爬蟲大作業產生的c ...

2019-06-12 01:14 0 870 推薦指數:

查看詳情

大數據應用期末大作業

這個作業的要求來自:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/3339。 首先,我是分析B站最火番劇劇迷們的評論,也就是我前面的文章------爬蟲大作業分析的數據。下面開始進行HIVE分析。 1.數據導入 ...

Tue Jun 11 17:16:00 CST 2019 0 1811
爬蟲綜合大作業

作業要求來自於:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/3075 熱門微博— —996與日劇《我要准時下班》   至此,“996話題”在微博上被傳得沸沸揚揚。微博上關於“996”的話題已超過千個,甚至更多 ...

Tue Apr 23 18:28:00 CST 2019 0 473
爬蟲綜合大作業

這個作業的要求來自於:https://edu.cnblogs.com/campus/gzcc/GZCC-16SE2/homework/3075 。 B站有很多號稱“鎮站之寶”的視頻,擁有着數量極其恐怖的評論和彈幕。這次我的目的就是爬取B站視頻的評論數據,分析某番劇為何會深受 ...

Thu Apr 25 06:41:00 CST 2019 0 574
大數據技術 - MapReduce 作業的運行機制

前幾章我們介紹了 Hadoop 的 MapReduce 和 HDFS 兩大組件,內容比較基礎,看完后可以寫簡單的 MR 應用程序,也能夠用命令行或 Java API 操作 HDFS。但要對 Hadoop 做深入的了解,顯然不夠用。因此本章就深入了解一下 MapReduce 應用的運行機制,從而學習 ...

Tue Apr 09 20:59:00 CST 2019 0 577
大數據技術Hadoop入門

之多樣 圖2-5 大數據特點之低價值密度 1.3 大數據應用場景 大數據應用場景如圖2-6 ...

Tue Apr 02 16:59:00 CST 2019 0 1237
大數據技術Hadoop筆試題

Hadoop有高容錯性的特點,並且設計用來部署在低廉的(low-cost)硬件上。以下是由應屆畢業生網小編J.L為您整理推薦的面試筆試題目和經驗,歡迎參考閱讀。   單項選擇題   1. 下面哪個程序負責 HDFS 數據存儲。   a)NameNode   b)Jobtracker ...

Mon Sep 26 20:31:00 CST 2016 0 1473
hadoop大數據技術架構詳解

大數據的時代已經來了,信息的爆炸式增長使得越來越多的行業面臨這大量數據需要存儲和分析的挑戰。Hadoop作為一個開源的分布式並行處理平台,以其高拓展、高效率、高可靠等優點越來越受到歡迎。這同時也帶動了hadoop商業版的發行。這里就通過大快DKhadoop為大家詳細介紹一下hadoop大數據平台 ...

Sun Apr 08 23:59:00 CST 2018 0 2629
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM