tensorflow feature column


功能

通过tensorflow 预定义的feature column 达到特征处理的功能.
工作流程:

  1. tesnsorflow dataset 产生迭代器返回解析后的tensor dict (即input_fn)
  2. 预定义 tensor dict 中(key, tensor) 的转化方式, 生成feature column
  3. 通过input_layer(feature_dict, feature_column) 生成转化后的feature 供模型使用

    p.s. 官网图中的input_layer函数实际上是在DNNClassifier中. 因此feature_column只是类似于定义一个函数操作. 数据处理则在DNNClassifier model_fn中.

feature column 类型

常用feature column

官方提供了常用的9种(上图下层)feature column, 用于特征处理. 通过这九种操作最终都会得到 category column / dense column 对象.

常用操作

首先我们需要知道, 可以将tensor 处理, 并输入模型的只有dense column. categorical column 只是转化的中间结果.
其次:

  1. category column 可以输入cross_column 生成交叉后的category column
  2. category column 可以作为embedding column, indicator_column 的输入, 转换为dense column
  3. embedding_column 可以通过share_embedding_column共享参数.(操作见另一篇博客)

其他操作

tf.contrib.feature_column 中包含了关于sequence tensor 的处理方式. 与之对应需要通过sequence_input_layer进行解析


免责声明!

本站转载的文章为个人学习借鉴使用,本站对版权不负任何法律责任。如果侵犯了您的隐私权益,请联系本站邮箱yoyou2525@163.com删除。



 
粤ICP备18138465号  © 2018-2025 CODEPRJ.COM