层次softmax函数（hierarchical softmax）

本文转载自查看原文 2018-04-13 10:50 9459 machine learning/ 分类

一、h-softmax

在面对label众多的分类问题时，fastText设计了一种hierarchical softmax函数。使其具有以下优势：

（1）适合大型数据+高效的训练速度：能够训练模型“在使用标准多核CPU的情况下10分钟内处理超过10亿个词汇”，特别是与深度模型对比，fastText能将训练时间由数天缩短到几秒钟。
（2）支持多语言表达：利用其语言形态结构，fastText能够被设计用来支持包括英语、德语、西班牙语、法语以及捷克语等多种语言。

可以认为，FastText= （word2vec中）CBOW + h-softmax；其结构为：输入 - 隐层 - h-softmax

将输入层中的词和词组构成特征向量，再将特征向量通过线性变换映射到隐藏层，隐藏层通过求解最大似然函数，然后根据每个类别的权重和模型参数构建Huffman树，将Huffman树作为输出。
这里写图片描述

Huffman树中每一叶子结点代表一个label，在每一个非叶子节点处都需要作一次二分类，走左边的概率和走右边的概率，这里用逻辑回归的公式表示

本站转载的文章为个人学习借鉴使用，本站对版权不负任何法律责任。如果侵犯了您的隐私权益，请联系本站邮箱yoyou2525@163.com删除。

猜您在找 层次聚类 Hierarchical Clustering Python-层次聚类-Hierarchical clustering 聚类分析之层次划分(Hierarchical、Birch) softmax函数机器学习笔记之聚类算法层次聚类 Hierarchical Clustering softmax函数理解 softmax 函数的理解和优点运用numpy求解softmax函数深入理解softmax函数 Softmax