【tf.keras】tensorflow datasets，tfds

本文轉載自查看原文 2019-11-23 22:35 772 tensorflow/ tensorflow_datasets/ keras

一些最常用的數據集如 MNIST、Fashion MNIST、cifar10/100 在 tf.keras.datasets 中就能找到，但對於其它也常用的數據集如 SVHN、Caltech101，tf.keras.datasets 中沒有，此時我們可以在 TensorFlow Datasets 中找找看。

tensorflow_datasets 里面包含的數據集列表：https://www.tensorflow.org/datasets/catalog/overview#all_datasets

tensorflow_datasets 安裝：pip install tensorflow_datasets

tensorflow_datasets 示例：

得到 tf.data.Dataset 對象：

import tensorflow as tf
import tensorflow_datasets as tfds

data, info = tfds.load("mnist", with_info=True)
print(info)

train_data, test_data = data['train'], data['test']
assert isinstance(train_data, tf.data.Dataset)
print(train_data)

得到 numpy.ndarray 對象：

import tensorflow_datasets as tfds
# `batch_size=-1`, will return the full dataset as `tf.Tensor`s.
dataset, info = tfds.load("mnist", batch_size=-1, with_info=True)
print(info)
train, test = dataset["train"], dataset["test"]
print(type(train['image']))

train = tfds.as_numpy(train)
print(type(train['image']))
print(train['image'].shape)
print(train['label'].shape)

tf.data.Dataset 進行簡單划分驗證集可以參考 https://github.com/tensorflow/datasets/issues/665#issuecomment-502409920

如果想對 MNIST 等數據集手動分層隨機划分出一個驗證集，還是轉化成 numpy.ndarray 比較方便，再使用 sklearn 的 train_test_split 方法一行代碼就可以搞定。

References

https://www.tensorflow.org/datasets
https://www.tensorflow.org/datasets/catalog/overview#all_datasets
https://github.com/tensorflow/datasets/blob/master/docs/splits.md

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 【tf.keras】TensorFlow 1.x 到 2.0 的 API 變化【tf.keras】tf.keras模型復現 tf.keras模型——Sequential 【tf.keras】官方教程一 Keras overview 【tensorflow】tf.keras + 神經網絡類class 6 步搭建神經網絡【tf.keras】AdamW: Adam with Weight decay tf.keras模型——backend后端API 【tf.keras】tf.keras加載AlexNet預訓練模型 python 3.7 安裝 sklearn keras(tf.keras) 【tf.keras】使用手冊