【文章推荐】强化学习在美团“猜你喜欢”的实践

原文：强化学习在美团“猜你喜欢”的实践

概述猜你喜欢是美团流量最大的推荐展位，位于首页最下方，产品形态为信息流，承担了帮助用户完成意图转化发现兴趣并向美团点评各个业务方导流的责任。经过多年迭代，目前猜你喜欢基线策略的排序模型是业界领先的流式更新的Wide amp Deep模型。考虑Point Wise模型缺少对候选集Item之间的相关性刻画，产品体验中也存在对用户意图捕捉不充分的问题，从模型特征入手，更深入地理解时间， ...

2018-11-16 16:47 1 918 推荐指数：

查看详情

美团深度学习系统的工程实践

背景深度学习作为AI时代的核心技术，已经被应用于多个场景。在系统设计层面，由于其具有计算密集型的特性，所以与传统的机器学习算法在工程实践过程中存在诸多的不同。本文将介绍美团平台在应用深度学习技术的过程中，相关系统设计的一些经验。本文将首先列举部分深度学习算法所需的计算量，然后再介绍为满足 ...

美团技术分享：美团深度学习系统的工程实践

更多美团技术分享收藏：MAYOU18-美团技术专栏背景深度学习作为AI时代的核心技术，已经被应用于多个场景。在系统设计层面，由于其具有计算密集型的特性，所以与传统的机器学习算法在工程实践过程中存在诸多的不同。本文将介绍美团平台在应用深度学习技术的过程中，相关系统设计的一些经验 ...

强化学习总结

强化学习总结 强化学习的故事 强化学习是学习一个最优策略(policy)，可以让本体(agent)在特定环境(environment)中，根据当前的状态(state)，做出行动(action)，从而获得最大回报(G or return)。有限马尔卡夫决策过程马尔卡夫决策过程理论 ...

强化学习——入门

强化学习： 强化学习作为一门灵感来源于心理学中的行为主义理论的学科，其内容涉及概率论、统计学、逼近论、凸分析、计算复杂性理论、运筹学等多学科知识，难度之大，门槛之高，导致其发展速度特别缓慢。一种解释：人的一生其实都是不断在强化学习，当你有个动作（action）在某个状态 ...

强化学习（MATLAB）

1. 定义机器学习算法可以分为3种：有监督学习（Supervised Learning）、无监督学习（Unsupervised Learning）和强化学习（Reinforcement Learning）。强化学习（Reinforcement Learning, RL），又称再励学习、评价学习 ...

什么是强化学习？

Reinforcement learning 是机器学习里面的一个分支，特别善於控制一只能够在某个环境下自主行动的个体 (autonomous agent)，透过和环境之间的互动，例如 sensory perception 和 rewards，而不断改进它的行为。听到强化学习 ...

强化学习杂谈

强化学习从入门到放弃目录 强化学习从入门到放弃杂谈 MDP MP MRP Bellman Equation MDP ...

强化学习之CartPole

0x00 任务通过强化学习算法完成倒立摆任务，控制倒立摆在一定范围内摆动。 0x01 设置jupyter登录密码 jupyter notebook --generate-config jupyter notebook password （会输入两次密码，用来验证 ...

原文：强化学习在美团“猜你喜欢”的实践

相关推荐

相关标签