原文:以大數據眼光欣賞唐人文墨(一)

Begin 上次用C 把 全唐詩 和 唐詩三百首 整理成為QData格式之后,就開始進行各種分析 詳細內容可以看看上次這篇文章, 用C 來學習唐詩三百首和全唐詩 接下來講一下分析的內容,由於筆者不是很懂文學和大數據統計什么的,所以只好隨便分析一通,首先分析的有:標題 作者 單字分析 還有詩句字數 也就是 五言 七言 標題分析 標題分析就是分析有多少首詩采用了某一個標題啦 首先是 唐詩三百首 從統計 ...

2017-03-18 17:49 10 996 推薦指數:

查看詳情

大數據眼光欣賞唐人文墨(二)代碼實現

Begin 繼上次對唐詩三百首和全唐詩四萬多首詩進行分析之后… 詳細內容可以看看上次這篇文章,《以大數據眼光欣賞唐人文墨(一)》 這篇文章來講講具體的代碼實現,本項目全部采用C#編寫。 軟件介紹 首先為了做本次分析,我用C#寫了一個Winform程序,名字很逗比,叫做 ...

Thu Apr 06 04:33:00 CST 2017 3 864
大數據

1.為什么產生大數據技術 對於“大數據”(Big data)研究機構Gartner給出了這樣的定義。“大數據”是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力來適應海量、高增長率和多樣化的信息資產。 隨着雲時代的來臨,大數據(Big data)也吸引了越來越多的關注。分析師 ...

Fri Sep 10 08:39:00 CST 2021 0 108
大數據之Scala

一、Scala入門 1.1 概述 1.1.1 為什么學習Scala 主要基於以下幾個原因: 1) 大數據主要的批處理計算引擎框架Spark是基於Scala語言開發的 2) 大數據主要的流式計算引擎框架Flink也提供了Scala相應的API ...

Mon Apr 27 01:19:00 CST 2020 0 1242
大數據

大數據 linux操作部分 1.創建用戶 進入root身份: su 輸入root密碼 創建新用戶: useradd zhang 給新用戶設置密碼: passwd zhang 給新用戶設置下次登陸時,更改密碼: chage -d 0 zhang ...

Sat Nov 13 00:10:00 CST 2021 0 165
什么是大數據

1.1 什么是大數據 主要解決:海量數據的存儲和海量數據的分析計算問題 大數據中的存儲單位:bit,byte,KB,MB,GB,TB,PB,EB,ZB 1byte = 8bit 1KB = 1024byte 1MB = 1024KB 1GB = 1024MB 1TB = 1024GB ...

Wed Oct 13 18:08:00 CST 2021 0 233
大數據技術

一.大數據預處理技術 現實世界中的數據一般是不完整的、 帶有隨機性的、有噪聲的或不唯一、不一致的“臟數據”,數據質量不高,無法直接進行數據挖掘,或者挖掘的效果差強人意。為了以后的處理更加方便以及模型具有更好的效果,往往在使用模型之前需要對數據進行預處理,就產生了數據預處理技術。 數據 ...

Tue Jul 06 07:43:00 CST 2021 0 228
大數據研發

大數據工程師(開發)面試題(附答案) MapReduce 1. 不指定語言,寫一個WordCount的MapReduce 我:最近剛學了scala,並且就有scala版本的WordCount,剛好學以致用了一下: 補:至於java版本,蝦皮博主的一篇文章講解 ...

Thu Oct 26 03:35:00 CST 2017 0 2259
大數據概論

大數據概述 1、大數據時代 1.第三次信息化浪潮 根據IBM前首席執行官郭士納的觀點,IT領域每隔十五年就會迎來一次重大變革。 信息化浪潮 發生時間 標志 解決問題 代表企業 第一次浪潮 1980年前 ...

Wed May 16 03:42:00 CST 2018 0 1696
 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM