转载至: https://download.csdn.net/download/tox33/10821291
下载链接: 点我一键跳转到 下载链接
下载声明: 本资料仅供个人学习和研究使用,不能用于商业用途,请在下载后24小时内删除。如果喜欢,请购买正版!
本文意旨分享程序员在阿里学习的技术与实际业务创新现实应用,了解阿里团队解决大数据背景下实际问题思想和经验,本文抛砖引,给业界和学术界带来一些输入,共同推进深度强化学习的更好发展。
第一章:基于强化学习的实时搜索排序策略调控
第二章:延迟奖赏在搜索排序场景中的作用分析
第三章:基于多智能体强化学习的多场景联合优化
第四章:强化学习在淘宝锦囊推荐系统中的应用
第五章:基于强化学习的引擎性能优化
第六章:基于强化学习分层流量调控
第七章:风险商品流量调控
第八章:虚拟淘宝
第九章:组合优化视角下基于强化学习的精准定向广告OCPC 业务优化
第十章:策略优化方法在搜索广告排序和竞价机制中的应用
第十一章:TaskBot -阿里小蜜的任务型问答技术
第十二章:DRL 导购-阿里小蜜的多轮标签推荐技术