登录
注册
首页
->
2022人工智能知识
下载题库
以下选项中,通过接收奖励信号来改善行为,从而获得最优策略的是()
(A)监督学习
(B)无监督学习
(C)强化学习
(D)迁移学习
参考答案
继续答题:
下一题
更多2022人工智能知识试题
1
NCE-Fabric可实现的容器上下线最快速度是()
2
赔偿请求人提出赔偿请求的方式有()。
3
以下关于ManageOne统一产品目录的描述,正确的是哪些项?多选
4
某计算机系统的可靠性结构如下所示,若所构成系统的每个部件的可靠度分别为R1、R2、R3和R4,则该系统的可靠度为( )。在这里插入图片描述
5
相对数使用时要注意以下几点,其中哪一项是不正确的
6
暗涵是指洞顶填土高度大于( )的涵。
考试