正交信號校正
https://wenku.baidu.com/view/f446cf4169eae009581bec54.html
第一步是歸一化的問題:https://blog.csdn.net/weixin_40683253/article/details/81508321
這里面的標准化很有價值:https://blog.csdn.net/sinat_29957455/article/details/79490165
https://blog.csdn.net/u012609509/article/details/78554709
標准化比歸一化要更加實用,因為像邏輯斯蒂回歸和支持向量機算法,
剛開始訓練的時候會將參數初始化為0或趨於0的隨機極小值,
如果是標准化的數據(均值為0,方差為1)對於它們而言,這更加容易利於權重的更新【為什么???】。將特征列標准化的計算公式如下
所給的程序:
import pandas as pd
from sklearn.preprocessing import MinMaxScaler
from sklearn.preprocessing import StandardScaler
if __name__ == "__main__":
# 讀取葡萄酒數據集
data = pd.read_csv("G:/dataset/wine.csv")
# 獲取第二列Alcohol
x = data["Alcohol"]
std = StandardScaler()
#將x進行標准化
x_std = std.fit_transform(x)
print(x_std)
---------------------
作者:修煉之路
來源:CSDN
原文:https://blog.csdn.net/sinat_29957455/article/details/79490165
版權聲明:本文為博主原創文章,轉載請附上博文鏈接!
還有一個說明:
並不是所有的標准化都能給estimator帶來好處。
“Standardization of a dataset is a common requirement for many machine learning estimators: they might behave badly if the individual feature do not more or less look like standard normally distributed data (e.g. Gaussian with 0 mean and unit variance).”
---------------------
作者:cltdevelop
來源:CSDN
原文:https://blog.csdn.net/u012609509/article/details/78554709
版權聲明:本文為博主原創文章,轉載請附上博文鏈接!
綜上也就是說,標准化有利於權重的更新,但是也許會帶來更糟的效果,因為如果數據本身不符合正態分布。???
這里還是有很多問題需要深究一下的。
標准化和歸一化區別:https://www.jb51.net/article/143571.htm
。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
下一步是Python的pca得到第一個主成分:
https://blog.csdn.net/i_is_a_energy_man/article/details/76599400
。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
第三步,這里是求正交的。感覺不是很好。
https://blog.csdn.net/qq_41672744/article/details/79157169
生成一個3*3的單位矩陣:
I=np.eye(3,3)
#說明array進行內積以后已經不是array對象,成為ndarray對象,不能再進行.I,.T,.M的操作。
#解決方法:把結果轉為matrix就可以 【這里的matrix是不是新的數據類型???】
關於matrix的解釋:https://blog.csdn.net/zhihaoma/article/details/51002742
這里矩陣的逆的一個求法:https://www.cnblogs.com/chamie/p/4870078.html
。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。。
Python求一個向量的模:https://blog.csdn.net/qq_15505637/article/details/82427116
import numpy as np
x = np.array([1,2,3,4,5])
np.linalg.norm(x)