介紹Tensorflow dataset空間下API的使用,dataset API主要用於讀取數據。本屆課程通過在房價預測問題上的實戰詳細的介紹如何使用tf.dataset讀取csv文件和tfrecord文件。
tf.data在tensorflow中是用於處理數據的,主要用來讀取數據,並在一些數據中做一些預處理,然后把數據塞給訓練程序去進行訓練.
實戰內容:
Dataset基礎API使用.
Dataset讀取csv文件.
Dataset讀取tfrecord文件.
API列表:
Dataset基礎使用(tf.data.Dataset.from_tensor_slices; repeat,batch,interleave,map,shuffle,list_files);
csv(tf.data.TextLineDataset,tf.io.decode_csv);
Tfrecord(tf.train.FloatLlist,tf.train.Int64,tf.trian.BytesList; tf.train.Feature,tf.train.Features,tf.train.Example; example.SerializeToString; tf.io.ParseSingExample; tf.io.VarLenFeature,tf.io.FixedLenFeature; tf.data.TFRecordDataset,tf.io.TFRecordOptions)
data_API引入
tf_data基礎API使用
生成csv文件
tf.io.decode_csv使用
tf.data讀取csv文件並與tf.keras結合使用
tfrecord基礎API使用
生成tfrecords文件
tf.data讀取tfrecord文件並與tf.keras結合使用
總結:
Dataset基礎API使用:
如何從內存中的數據中構建dataset, 然后講解了很多API的使用方法,包括Repeat,batch,shuffle,map,interleave,take等等
Dataset讀取csv文件:
主要講解了如何使用dataset中的API去解析csv的列
Dataset讀取tfrecord文件:
重點講解了tf.train.examplle的序列化和解析