登录  注册

首页->东数西算

Q函数Q( s,a)是指在一个给定状态s下,采取某一个动作a之后,后续的各个状态所能得到的回报的( )

(A)期望值

(B)最大值

(C)最小值

(D)总和

参考答案
继续答题:下一题
微考学堂微考学社

更多东数西算试题

考试