Model 21 多臂老虎机问题
第二种启发式称为 〔自适应探测率启发式〕
它的程序是
第 Ⅰ 阶段
先让每种备选方案各完成10次试验
第 Ⅱ 阶段
进行总共20次试验
但是试验次数根据各备选方案在第一阶段的成功率按比例分配

热门评论
  • 还没有评论,快来抢沙发吧~