背景 松哥常言统计分三级:“初级说一说,中级比一比,高级找关系”;今天所言之题,即为高级找关系之一法。聚类与判别,所谓天下合久必分、分久必合,合则聚类,分则判别。 1.聚类分析 根据研究对象特征 ...
背景 松哥常言统计分三级:“初级说一说,中级比一比,高级找关系”;今天所言之题,即为高级找关系之一法。聚类与判别,所谓天下合久必分、分久必合,合则聚类,分则判别。 1.聚类分析 根据研究对象特征 ...
文章来源:社经研究社(ID:SES-2019) 在回归分析中,我们常常关心系数估计值是否稳定,即如果将整个样本分成若干个子样本分别进行回归,是否还能得到大致相同的估计系数。对于时间序列数据,这 ...
随着我们对深度学习网络认知的加深,在实际应用过程中,我们一定会厌倦深度网络训练时间长,参数规模太大而感到非常痛苦.那么今天我给大家带来的是如何实现网络剪枝.也就是在不降低准确度的情况下减少训练参数 ...
分享嘉宾:王琛@神策数据 编辑整理:冯露 出品平台:DataFunTalk 导读:用户画像是建立在数据基础之上的用户模型,是产品改进、精准营销等业务场景中不可或缺的重要基础。而 ...
来自公众号:码海 前言 大家好,我是坤哥,今天我想和大家聊一聊实时索引的构建之道,来自我司 PB 级索引数据的实战经验,相信对大家肯定有帮助。 近年来公司业务迅猛发展,数据量爆炸式增长,随 ...
导读:本文详细介绍用户标签体系的构成及应用场景。 作者:赵宏田来源:大数据DT(ID:hzdashuju) 互联网相关企业在建立用户画像时一般除了基于用户维度(userid)建立一 ...
商品知识图谱作为新零售行业数字化的基石,提供了围绕商品的精准结构化理解,对业务应用起到了至关重要的作用。相比于美团大脑中原有的围绕商户的图谱而言,商品图谱需应对更加分散、复杂、海量的数据和业务场景,且 ...
特征工程系列:GBDT特征构造以及聚类特征构造 本文为数据茶水间群友原创,经授权在本公众号发表。 关于作者:JunLiang,一个热爱挖掘的数据从业者,勤学好问、动手达人,期待与大家一起交流探讨机 ...
特征工程系列:聚合特征构造以及转换特征构造 本文为数据茶水间群友原创,经授权在本公众号发表。 关于作者:JunLiang,一个热爱挖掘的数据从业者,勤学好问、动手达人,期待与大家一起交流探讨机器学 ...
前言: 我根据自己的科研方向和实际工作,在利用R语言解决数据,特征和模型三方面的问题时,会搜集到一些R代码,利用【R语言】公众号将其整理和归总,分享给大家。一方面,希望这些R代码能够对大家解决实际问 ...