原文:百度PaddlePaddle入门-10(数据处理)

在 手写数字识别 案例的快速入门中,我们调用飞桨提供的API paddle.dataset.mnist 加载MNIST数据集。但在工业实践中,我们面临的任务和数据环境千差万别,需要编写适合当前任务的数据处理程序。 但是编写自定义的数据加载函数,一般会涉及以下四个部分: 数据读取与数据集划分 定义数据读取器 校验数据的有效性 异步数据读取 在数据读取与处理前,首先要加载飞桨平台和数据处理库,可能使 ...

2020-02-09 15:04 2 2224 推荐指数:

查看详情

百度PaddlePaddle入门-3(框架)

深度学习在很多机器学习领域均有非常出色的表现,在图像识别、语音识别、自然语言处理、机器人、网络广告投放、医学自动诊断和金融等各大领域有着广泛的应用。面对繁多的应用场景,深度学习框架可以节省大量而繁琐的外围工作,使建模者关注业务场景和模型设计本身。 使用深度学习框架完成建模任务有两个显著优势 ...

Tue Feb 04 21:24:00 CST 2020 0 2068
百度PaddlePaddle入门-9(建模)

本节介绍使用飞桨快速实现“手写数字识别”的建模方法。 与“房价预测”的案例类似,我们以同样的标准结构实现“手写数字识别”的建模。在后续的课程中,该标准结构会反复出现,逐渐加深我们对深度学习模型的理解。深度学习模型的标准结构分如下五个步骤: 数据处理:读取数据 ...

Sun Feb 09 17:47:00 CST 2020 0 1220
百度PaddlePaddle入门-6 (Numpy应用)

线性代数 Numpy中实现了线性代数中常用的各种操作,并形成了numpy.linalg线性代数相关的模块。其中包括: diag 以一维数组的形式返回方阵的对角线(或非对角线)元素, ...

Sat Feb 08 02:28:00 CST 2020 0 695
百度PaddlePaddle入门-16(模型加载及恢复训练)

将训练好的模型保存到磁盘之后,应用程序可以随时加载模型,完成预测任务。但是在日常训练工作中我们会遇到一些突发情况,导致训练过程主动或被动的中断。如果训练一个模型需要花费几天的训练时间,中断后从初始状态 ...

Thu Feb 27 19:16:00 CST 2020 0 3265
百度PaddlePaddle入门-12(损失函数)

损失函数是模型优化的目标,用于衡量在无数的参数取值中,哪一个是最理想的。损失函数的计算在训练过程的代码中,每一轮的训练代码均是一致的过程:先根据输入数据正向计算预测输出,再根据预测值和真实值计算损失,最后根据损失反向传播梯度并更新参数。 在之前的方案中,我们照抄了房价预测模型的损失函数-均方误差 ...

Wed Feb 12 01:13:00 CST 2020 0 1371
百度PaddlePaddle入门-14(多个CPU加速训练)

接下来介绍在paddlepaddle中如何使用多CPU来加速训练。 接着前面几节讲的手写数字识别部分,在启动训练前,加载数据和网络结构的代码部分均不变。 View Code 单GPU训练 现实生活中,我们可能会遇到更复杂的机器学习、深度学习任务 ...

Sun Feb 23 16:30:00 CST 2020 0 3375
百度PaddlePaddle入门-15(训练中的调试与优化)

在模型训练部分,为了保证模型的真实效果,我们需要对模型进行一些调试和优化,主要分为以下五个环节: 计算分类准确率,观测模型训练效果。 交叉熵损失函数只能作为优化目标,无 ...

Mon Feb 24 18:55:00 CST 2020 0 1707
 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM