數據分析小組大作業
- 1. 畢業意向
本科階段目前想法是考研。專業方向目前初步定為向大數據領域的數據挖掘、數據分析、和機器學習方向,同時Hadoop大數據開發也是我想要發展方向,本科階段希望能夠熟練掌握這些技術。未來最可能從事大數據分析方面的工作。
- 2. 對數據分析的認識
- 數據分析:數據分析是指用適當的統計分析方法對收集來的大量數據進行分析,提取有用信息和形成結論而對數據加以詳細研究和概括總結的過程。這一過程也是質量管理體系的支持過程。在實用中,數據分析可幫助人們作出判斷,以便采取適當行動。
2.類型:在統計學領域,有些人將數據分析划分為描述性統計分析、探索性數據分析 以及驗證性數據分析;其中,探索性數據分析側重於在數據之中發現新的特征,而驗證性數據分析則側重於已有假設的證實或證偽。
探索性數據分析是指為了形成值得假設的檢驗而對數據進行分析的一種方法,是對傳 統統計學假設檢驗手段的補充。該方法由美國著名統計學家約翰·圖基(John Tukey)命名。
定性數據分析又稱為“定性資料分析”、“定性研究”或者“質性研究資料分析”,是指對諸如詞語、照片、觀察結果之類的非數值型數據(或者說資料)的分析。
3.分析工具:Excel作為常用的分析工具,可以實現基本的分析工作,在商業智能領域Cognos、Style Intelligence、Microstrategy、Brio、BO和Oracle以及國內產品如Yonghong Z-Suite BI套件等。
4.具體方法:數據分析有極廣泛的應用范圍。典型的數據分析可能包含以下三個步:
(1)探索性數據分析:當數據剛取得時,可能雜亂無章,看不出規律,通過作圖、造表、用各種形式的方程擬合,計算某些特征量等手段探索規律性的可能形式,即往什么方向和用何種方式去尋找和揭示隱含在數據中的規律性。
(2)模型選定分析,在探索性分析的基礎上提出一類或幾類可能的模型,然后通過進一步的分析從中挑選一定的模型。
(3)推斷分析:通常使用數理統計方法對所定模型或估計的可靠程度和精確程度作出推斷。
5.分析方法:(1)列表法(2)作圖法(3)數據分析主要包含:
1. 簡單數學運算(Simple Math)
2.統計(Statistics)
3. 快速傅里葉變換(FFT)
4. 平滑和濾波(Smoothing and Filtering)
5.基線和峰值分析(Baseline and Peak Analysis)
3.選擇理由、對數據分析小組的意見與困難
數據分析是大數據技術領域的一個方向,未來從事大數據分析師的話,精通數據分析對我很有幫助,未來也可以從事數據分析師這個職業。因為處於初步階段對專業領域了解較少,缺少自己的見解與想法,處於迷茫期,在接下來的學習中拓展視野,增長知識。畢竟是憑着自己的意願加入的數據分析學習,對自制力,自我學習能力要求高。現階段我認為還有必要老師多建議,指導。
4.2020年春學期學習計划
熟練掌握Python,Java基礎
參加比賽積累經驗提高算法編程能力
學習Linux操作系統及其工作原理
數據結構與數據庫的學習與應用
5.寒假學習目標
1.每日至少三小時的Java算法刷題(25天)
2.每日兩小時的python基礎學習(25天)
3.書籍閱讀一小時(每天)
4.英語相關的學習至少30分鍾(每天)
