拋出問題:為什么前面的線性回歸要用最小二乘法?為什么要用這樣的指標? 下面我們會給出一系列的概率假設,從而導出最小二乘法是一個很自然的算法: 先設 y^(i) = θTx^(i) + ε(i), 其中ε(i)叫做誤差項 error term,這個可以看作是對未 ...
在數據分析統計的場景里,常用的方法除了描述性統計方法外,還有推斷統計方法,如果再從工作性質上來划分,推斷統計包含了參數估計和假設驗證這兩方面的內容。而推斷統計用到了很多概率統計方法,所以本小節在介紹推斷統計的內容前,還將講述一些常用的概率統計方法。 分析收盤價,繪制小提琴圖 小提琴圖綜合了箱狀圖與核密度圖的特性,從箱狀圖里能看出數據的各分位數,而從核密度圖里,能看出樣本數據的分布情況,即每個數值 ...
2021-02-15 15:49 0 393 推薦指數:
拋出問題:為什么前面的線性回歸要用最小二乘法?為什么要用這樣的指標? 下面我們會給出一系列的概率假設,從而導出最小二乘法是一個很自然的算法: 先設 y^(i) = θTx^(i) + ε(i), 其中ε(i)叫做誤差項 error term,這個可以看作是對未 ...
前面的《自動掃雷》系列博文介紹了如何從XP自帶的掃雷游戲中獲取游戲、分析確定情況下的雷塊,以及操作鼠標完成游戲。這篇將介紹如何使用數學中的概率知識來玩掃雷游戲,也正是本人最想介紹的地方,即《前言》中所說的第四種掃雷模型的分析。 先看游戲界面,如下: 在游戲開始時,如何出現這樣的情況 ...
統計推斷(statistical inference),在計算機科學中也被稱為“機器學習”,是使用數據推斷生成數據分布的過程 一個經典的統計推斷問題是:給一個樣本(\(\sim\)意味X_1,...,X_n獨立且相互都有相同的邊緣分布函數,即是來自F簡單隨機樣本)\(X_1,...,X_n ...
前面分析統計了金庸名著《倚天屠龍記》中人物按照出現次數並排序 https://www.cnblogs.com/becks/p/11421214.html 然后使用pyecharts,統計B站某視頻彈幕內容,並繪制成詞雲顯示 https://www.cnblogs.com/becks/p ...
概述 現代統計分析包括兩個部分,描述性統計和統計推斷。 描述性統計包括數值型描述統計和圖表型描述統計。數值型描述統計包括集中趨勢和變異程度,集中趨勢包括均值、中位數、眾數等,變異程度包括標准差、方差、四分位距等;圖表型描述包括條線餅點箱等,我比較喜歡箱型圖。 統計推斷包括參數估計和假設檢驗 ...
總體的假設檢驗問題。在樣本很大(一般,最好或),可以使用中心極限定理進行分析。 ...
最近我出了一本書,《基於股票大數據分析的Python入門實戰 視頻教學版》,京東鏈接:https://item.jd.com/69241653952.html,在其中用股票范例講述Python爬蟲、數據分析和機器學習的技術,大家看了我的書,不僅能很快用比較熱門的案例學好Python,更能 ...
1. 總體與樣本 0x1:數理統計中為什么要引入總體和個體這個概念 概率論與數理統計中,一個很重要的研究對象就是總體的概率分布,理論上說,我們希望獲得被研究對象的總體樣本,基於這份總體樣本進一步研究其概率分布,但是遺憾地是,幾乎在100%的情況下,我們都不可能獲得真正的總體,我們只能獲取有限 ...