在包含 N 个文档的语料库中,随机选择一个文档。该文件总共包含 T 个词,词条「数据」出现 K 次。 如果词条「数据」出现在文件总数的数量接近三分之一,则 TF(词频)和 IDF(逆文档频率)的乘积的正确值是多少?
(A)KT * Log(3)
(B)选项1
(C)T * Log(3) / K
(D)Log(3) / KT
参考答案
继续答题:下一题
![微考学堂](/images/gzh.png)
![微考学社](/images/xcx.png)
更多2022人工智能知识试题
- 1实际电网的调度系统通过()采集电力系统中各电力设备的运行状态。
- 2在强化学习中,哪个机制的引入使得强化学习具备了在利用与探索中寻求平衡的能力
- 3下列的哪种方法可以用来降低深度学习模型的过拟合问题? 1 增加更多的数据 2 使用数据扩增技术(data augmentation) 3 使用归纳性更好的架构 4 正规化数据 5 降低架构的复杂度
- 4生产控制大区主机操作系统应当进行安全加固。加固方式包括:( )。关键控制系统软件升级、补丁安装前要请专业技术机构进行安全评估和验证。
- 5假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15,35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?