花費 10 ms
使用sklearn做單機特征工程

目錄 1 特征工程是什么?2 數據預處理  2.1 無量綱化    2.1.1 標准化    2.1.2 區間縮放法    2.1.3 標准化與歸一化的區別  2.2 對定量特征二值化  2.3 對 ...

Tue May 03 01:41:00 CST 2016 25 122491
特征選擇 (feature_selection)

特征選擇 (feature_selection) 目錄 特征選擇 (feature_selection) Filter 1. 移除低方 ...

Tue Mar 14 00:45:00 CST 2017 5 76032
特征工程之特征選擇

    特征工程是數據分析中最耗時間和精力的一部分工作,它不像算法和模型那樣是確定的步驟,更多是工程上的經驗和權衡。因此沒有統一的方法。這里只是對一些常用的方法做一個總結。本文關注於特征選擇部分。后面 ...

Mon May 14 04:13:00 CST 2018 95 35529
特征工程之特征表達

在特征工程之特征選擇中,我們講到了特征選擇的一些要點。本篇我們繼續討論特征工程,不過會重點關注於特征表達部分,即如果對某一個特征的具體表現形式做處理。主要包括缺失值處理,特殊的特征 ...

Sun May 20 06:39:00 CST 2018 97 18325
特征工程之特征預處理

    在前面我們分別討論了特征工程中的特征選擇與特征表達,本文我們來討論特征預處理的相關問題。主要包括特征的歸一化和標准化,異常特征樣本清洗與樣本數據不平衡問題的處理。 1. 特征的標准化和歸一化 ...

Sun May 27 04:23:00 CST 2018 102 17762
誰動了我的特征?——sklearn特征轉換行為全記錄

目錄 1 為什么要記錄特征轉換行為?2 有哪些特征轉換的方式?3 特征轉換的組合4 sklearn源碼分析  4.1 一對一映射  4.2 一對多映射  4.3 多對多映射5 實踐6 總結7 參考資 ...

Fri Jul 01 05:33:00 CST 2016 3 30259
學習《精通特征工程》中文PDF+英文PDF+代碼對比

特征工程是機器學習流程中至關重要的一個環節,這方面的書較少,推薦學習《精通特征工程》,着重闡明特征工程的基本原則,介紹大量特征工程技術,學習從原始數據中提取出正確的特征並將其轉換為適合機器學習模型的格 ...

Thu May 23 07:03:00 CST 2019 0 8312
數據預處理之離散化

按照我們對於變量的分類:分為數值變量和分類變量,數值變量可以分為連續型和離散型,分類變量又有有序的和無序的。下面我將介紹一些對於這些變量進行離散化處理。 無序分類變量的離散化方法: 比如 ...

Fri Mar 16 05:19:00 CST 2018 1 16167
評分卡系列(二):特征工程

時間:JSong 時間:2018.01.14 文章很長,理論和實現都講的很細,大家可以先收藏,有時間再看。 在上一篇文章中,我們對LendingClub的數據有了一個大致的了解,這次我將 ...

Mon Jan 15 03:37:00 CST 2018 4 11810

 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM