第七章测试
1.本项目在文字转换成数字特征过程中,文本中每个词的编号是:( )。
A:随机生成的一个数 B:随机生成的一个整数 C:根据词频,词频越大,编号越小 D:根据词频,词频越大,编号越大
答案:C
2.随机森林是Bagging的一个扩展变体,它以()作为基学习器构建Bagging集成,在决策树的训练过程中引入了随机属性选择。( )。
A:朴素贝叶斯分类器 B:支持向量机 C:K近邻 D:决策树 3.计算机病毒造成的危害是:( )
A:破坏计算机系统 B:使计算机内存芯片损坏 C:使磁盘发霉 D:使计算机系统突然掉电 4.本项目数据预处理包含下列哪几个步骤:( )。
A:去停用词 B:文本向量化 C:数据清洗 D:分词 5.在针对西尼罗河病毒预测过程中数据预处理用到了处理缺失值的手段。若数据集中仅存在少量的缺失值,则处理缺失值的一般方法有:( )。
A:使用中位数插补 B:删除缺失值所在的整行 C:使用众数插补 D:删除缺失值所在的整列

温馨提示支付 ¥3.00 元后可查看付费内容,请先翻页预览!
点赞(36) dxwkbang
返回
顶部