【文章推荐】百度PaddlePaddle入门-10（数据处理）

原文：百度PaddlePaddle入门-10（数据处理）

在手写数字识别案例的快速入门中，我们调用飞桨提供的API paddle.dataset.mnist 加载MNIST数据集。但在工业实践中，我们面临的任务和数据环境千差万别，需要编写适合当前任务的数据处理程序。但是编写自定义的数据加载函数，一般会涉及以下四个部分：数据读取与数据集划分定义数据读取器校验数据的有效性异步数据读取在数据读取与处理前，首先要加载飞桨平台和数据处理库，可能使 ...

2020-02-09 15:04 2 2224 推荐指数：

查看详情

百度PaddlePaddle入门-3（框架）

深度学习在很多机器学习领域均有非常出色的表现，在图像识别、语音识别、自然语言处理、机器人、网络广告投放、医学自动诊断和金融等各大领域有着广泛的应用。面对繁多的应用场景，深度学习框架可以节省大量而繁琐的外围工作，使建模者关注业务场景和模型设计本身。使用深度学习框架完成建模任务有两个显著优势 ...

百度PaddlePaddle入门-5（Numpy，Random）

，通常会使用Numpy实现数据预处理和一些模型指标的计算，飞桨中的Tensor数据可以很方便的和ndarr ...

百度PaddlePaddle入门-9（建模）

本节介绍使用飞桨快速实现“手写数字识别”的建模方法。与“房价预测”的案例类似，我们以同样的标准结构实现“手写数字识别”的建模。在后续的课程中，该标准结构会反复出现，逐渐加深我们对深度学习模型的理解。深度学习模型的标准结构分如下五个步骤： 数据处理：读取数据 ...

百度PaddlePaddle入门-6 (Numpy应用)

线性代数 Numpy中实现了线性代数中常用的各种操作，并形成了numpy.linalg线性代数相关的模块。其中包括： diag 以一维数组的形式返回方阵的对角线（或非对角线）元素， ...

百度PaddlePaddle入门-16（模型加载及恢复训练）

将训练好的模型保存到磁盘之后，应用程序可以随时加载模型，完成预测任务。但是在日常训练工作中我们会遇到一些突发情况，导致训练过程主动或被动的中断。如果训练一个模型需要花费几天的训练时间，中断后从初始状态 ...

百度PaddlePaddle入门-12（损失函数）

损失函数是模型优化的目标，用于衡量在无数的参数取值中，哪一个是最理想的。损失函数的计算在训练过程的代码中，每一轮的训练代码均是一致的过程：先根据输入数据正向计算预测输出，再根据预测值和真实值计算损失，最后根据损失反向传播梯度并更新参数。在之前的方案中，我们照抄了房价预测模型的损失函数-均方误差 ...

百度PaddlePaddle入门-14（多个CPU加速训练）

接下来介绍在paddlepaddle中如何使用多CPU来加速训练。接着前面几节讲的手写数字识别部分，在启动训练前，加载数据和网络结构的代码部分均不变。 View Code 单GPU训练现实生活中，我们可能会遇到更复杂的机器学习、深度学习任务 ...

百度PaddlePaddle入门-15（训练中的调试与优化）

在模型训练部分，为了保证模型的真实效果，我们需要对模型进行一些调试和优化，主要分为以下五个环节：计算分类准确率，观测模型训练效果。交叉熵损失函数只能作为优化目标，无 ...

原文：百度PaddlePaddle入门-10（数据处理）

相关推荐

相关标签