摘要:CDL是一种简单、高效的数据实时集成服务,能够从各种OLTP数据库中抓取Data Change事件,然后推送至Kafka中,最后由Sink Connector消费Topic中的数据并导入到大 ...
本文始发于个人公众号:TechFlow,原创不易,求个关注 今天是机器学习真题的第 篇文章,我们来讲讲机器学习模型的评估。 在之前的文章当中我们已经介绍了好几个模型了,有朴素贝叶斯 KNN KMeans EM还有线性回归和逻辑回归。今天我们来和大家聊聊该怎么评估这些模型。 均方差 这个概念很简单,它和回归模型当中的损失函数是一样的。可以理解成我们预测值和真实值之间的偏差,我们用y表示样本的真实值, ...
2020-04-22 21:18 0 901 推荐指数:
摘要:CDL是一种简单、高效的数据实时集成服务,能够从各种OLTP数据库中抓取Data Change事件,然后推送至Kafka中,最后由Sink Connector消费Topic中的数据并导入到大 ...
书接上文,一文加深你对Java线程池的了解与使用—筑基篇,本文将从线程池内部的最最核心类 ThreadPoolExecutor 源码中的重要方法入手,也是本文分析的对象,从状态/任务/线程这三个模块剖析线程池的机制,掌握背后的核心设计。 一、线程池如何管理自身的状态/生命周期 ...
一、概述 召回率、准确率、精确率、F值的作用 在机器学习、数据挖掘、推荐系统完成建模之后,需要对模型的效果做评价。 二、定义 首先给出一个大家经常见到的图: 详细定义 准确率(accuracy)=(TP+TN)/(TP+FN+FP+TN) 通俗解释: 在所有样本中 ...
,这样在看实现代码的时候至少有一个整体的概念,重点要记住的是Node类几种状态的作用,其他结构有个概念就行 ...
经常提到数据库的事务,那你知道数据库还有事务隔离的说法吗,事务隔离还有隔离级别,那什么是事务隔离,隔离级别又是什么呢?本文就帮大家梳理一下。 MySQL 事务 本文所说的 MySQL 事 ...
上篇文章介绍了Netty内存模型原理,由于Netty在使用不当会导致堆外内存泄漏,网上关于这方面的资料比较少,所以写下这篇文章,专门介绍排查Netty堆外内存相关的知识点,诊断工具,以及排查思路提 ...
转载请引用:一个故事讲清楚NIO 假设某银行只有10个职员。该银行的业务流程分为以下4个步骤: 1) 顾客填申请表(5分钟); 2) 职员审核(1分钟); 3) 职员叫保安去金库取钱(3分钟); 4) 职员打印票据,并将钱和票据返回给顾客(1分钟)。 我们看看银行不同的工作方式 ...
什么是GC? GC(garbage collection)是对内存管理中回收已经不用的内存的一种机制,我们熟知的java和.net都有自己的GC机制,是内存管理的一部分。 为什么会有GC呢?是因为 ...