标签【论文阅读】

ImageNet历年冠军和相关CNN模型

ImageNet 是一个超过15 million的图像数据集，大约有22,000类。是由李飞飞团队从2007年开始，耗费大量人力，通过各种方式（网络抓取，人工标注，亚马逊众包平台）收集制 ...

前言本文主要介绍2012-2015年的一些经典CNN结构，从AlexNet，ZFNet，OverFeat到VGG，GoogleNetv1-v4，ResNetv1-v2。在论文笔记：CNN经典结构 ...

2014 TKDE(IEEE Transactions on Knowledge and Data Engineering) 张敏灵，周志华简单介绍传统监督学习主要是单标签学习，而现实生活中目标 ...

一：原始信号从音频文件中读取出来的原始语音信号通常称为raw waveform，是一个一维数组，长度是由音频长度和采样率决定，比如采样率Fs为16KHz，表示一秒钟内采样16000个点，这个时候如果 ...

语音信号（声音是什么）声音是由物体振动产生的声波，是通过介质（空气或固体、液体）传播并能被人或动物听觉器官所感知的波动现象，最初发出振动的物体叫声源。声音（语音消息）的基本模拟形式是一种称为语音信 ...

2015, NIPS **Max Jaderberg, Karen Simonyan, Andrew Zisserman, Koray Kavukcuoglu ** Google DeepMind ...

一：An Attention Pooling based Representation Learning Method for Speech Emotion Recognition（2018 Inte ...

前言在论文笔记：CNN经典结构1中主要讲了2012-2015年的一些经典CNN结构。本文主要讲解2016-2017年的一些经典CNN结构。 CIFAR和SVHN上，DenseNet-BC优于Res ...

目录 1.超分辨率图像超分辨率 PULSE: Self-Supervised Photo Upsampling via Latent ...

目录从零开始实现SSD目标检测（pytorch）第一章相关概念概述 1.1 检测框表示 1.2 交并比 ...