大數據分析處理必備工具


大數據技術,就是從各種類型的數據中快速獲得有價值信息的技術。大數據領域已經涌現出了大量新的技術,它們成為大數據采集、存儲、處理和展現的有力武器。

一、大數據接入
  1、大數據接入
      已有數據接入、實時數據接入、文件數據接入、消息記錄數據接入、文字數據接入、圖片數據接入、視屏數據接入
  2、大數據接入技術
      Kafka、ActiveMQ、ZeroMQ、Flume、Sqoop、Socket(Mina、Netty)、ftp/sftp
二、大數據存儲
  1、大數據存儲
      結構化數據存儲、半結構化數據存儲、非結構化數據存儲
  2、大數據存儲技術
      Hdfs、Hbase、Hive、S3、Kudu、MongoDB、Neo4J 、Redis、Alluxio(Tachyon)、Lucene、Solr、ElasticSearch
三、數據分析挖掘
  1、大數據分析與挖掘
      離線分析、准實時分析、實時分析、圖片識別、語音識別、機器學習
  2、大數據分析與挖掘技術
      MapReduce、Hive、Pig、Spark、Flink、Impala、Kylin、Tez、Akka、Storm、S4、Mahout、MLlib
      數據的分析離不開各種數據庫客戶端工具,例如P/L SQL, 查詢分析器,Navicat, shell等,客戶端工具繁多,安裝繁瑣,
      使用基於Web的TreeSoft數據庫管理系統,可以同時連接MySQL,Oracle,DB2,PostgreSQL, SQL Server, MongoDB, Hive, SAP HANA 十分方便。
      使用基於Web的工具有個好處是:一次布署,到處使用,省時省力。

四、大數據共享交換
   1、大數據共享交換
      數據接入、數據清洗、轉換、脫敏、脫密、數據資產管理、數據導出
      數據接入后,通常是存入數據庫中,以便於進行分析、清洗、轉換、脫敏等處理,而這些操作都離不開數據可視化客戶端工具。
      海量大數據需分批次,分任務,分時段進行處理,TreeSoft數據庫管理系統提供了數據定時任務管理,數據交換同步任務管理,
      任務統一管理,執行進度展示,處理日志查看等,十分強大,是大數據處理的好工具。

  2、大數據共享交換技術
      Kafka、ActiveMQ、ZeroMQ、Dubbo、Socket(Mina、Netty)、ftp/sftp、RestFul、Web Service


五、大數據展現
   1、大數據展現
      圖化展示(散點圖、折線圖、柱狀圖、地圖、餅圖、雷達圖、K線圖、箱線圖、熱力圖、關系圖、矩形樹圖、平行坐標、桑基圖、漏斗圖、儀表盤),文字展示;
2、大數據展現技術
      Echarts、Tableau,TreeSoft數據庫管理系統將SQL查詢結果直接以圖表展示,快速展現分析結果。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM