花费 6 ms
决策树与随机森林

首先,在了解树模型之前,自然想到树模型和线性模型有什么区别呢?其中最重要的是,树形模型是一个一个特征进行处理,之前线性模型是所有特征给予权重相加得到一个新的值。决策树与逻辑回归的分类区别也在于此 ...

Thu Sep 22 05:00:00 CST 2016 2 152178
逻辑回归LR

逻辑回归算法相信很多人都很熟悉,也算是我比较熟悉的算法之一了,毕业论文当时的项目就是用的这个算法。这个算法可能不想随机森林、SVM、神经网络、GBDT等分类算法那么复杂那么高深的样子,可是绝对不能小看 ...

Tue Sep 13 01:14:00 CST 2016 0 36209
聚类算法

一、聚类算法简介 聚类是无监督学习的典型算法,不需要标记结果。试图探索和发现一定的模式,用于发现共同的群体,按照内在相似性将数据划分为多个类别使得内内相似性大,内间相似性小。有时候作为监督学习中稀疏 ...

Thu Sep 15 07:33:00 CST 2016 2 25470
关联规则

关联规则:评定规则的标准 支持度:规则前项LHS和规则后项RHS所包括的商品都同时出现的概率,LHS和RHS商品的交易次数/总交易次数。 置信度:在所有的购买了左边商品的交易中,同时又购买了右边商 ...

Mon Dec 05 03:09:00 CST 2016 0 11677
阿里天池全国社保比赛心得

最近时间都忙于参加阿里天池的全国社会保险大数据应用创新大赛,终于结束,最终全国排名第7,总共是1336只队伍参加,还是很激动进了前10,今天想把一些体悟写一下,希望对后来参加的人有用。这 ...

Wed Sep 20 18:52:00 CST 2017 22 5767
python画决策树

1.安装graphviz。下载地址在:http://www.graphviz.org/。如果你是linux,可以用apt-get或者yum的方法安装。如果是windows,就在官网下载msi文件安装。 ...

Wed Dec 21 18:50:00 CST 2016 2 9133
金融行业数据分析

听了一个Talkingdata的首席金融行业专家鲍忠铁老师的分享,收益良多,把讲的一些笔记写下来了~以后分析可以提供一些思路~要学的东西是在太多。。。感觉我要看的书都可以堆个20本。。。时间不够用55 ...

Sun Aug 14 07:13:00 CST 2016 0 7833
PCA本质和SVD

一、一些概念 线性相关:其中一个向量可以由其他向量线性表出。 线性无关:其中一个向量不可以由其他向量线性表出,或者另一种说法是找不到一个X不等于0,能够使得AX=0。如果对于一个矩阵A来说它的列是 ...

Wed Sep 07 03:39:00 CST 2016 0 6800
分类模型评估

一直对于各种分类器评估的指标有点晕,今天决定琢磨下,并且写下来,方便以后回忆。 一、混淆矩阵 来源于信息论,根据上面的混淆矩阵,有3个指标需要搞清楚,我觉得记公式真的很容易搞混,建议大家 ...

Fri Oct 07 01:49:00 CST 2016 0 4517
自然语言预处理

#英文预处理 词共现矩阵的构建 https://github.com/urgedata/pythondata/blob/master/Text%20Analytics/ericbro ...

Fri Oct 26 19:53:00 CST 2018 0 989

 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM