微信咨询
电话咨询
文档VIP
VIP专享文档
免费专享文档
超值8折下载
不包含研报
赠送积分
不过期
首篇免费
仅限积分文档
纯净版体验
内容过滤无广告
VIP权威标识
彰显身份
专属客服
一对一服务
积分充值
消息
昵称未设置
未开通
0
已购文档
我的文档
我的专题
订单查询
积分变动
推介奖励
优惠券
收藏
账号安全
马尔可夫决策过程(Markov Decision Processes,简称MDP) 马尔可夫决策过程是基于马尔可夫过程理论的随机动态系统的最优决策过程。马尔可夫决策过程是序贯决策的主要研究领域。它是马尔可夫过程与确定性的动态规划相结合的产物,故又称马尔可夫型随机动态规划,属于运筹学中数学规划的一个分支。
微信扫码联系客服
©2024 MBAlib.com, All rights reserved. 闽公网安备 35020302032707号