第一章 单元测试

1、单选题:
对西瓜的成熟度进行预测得到结果为0.51,这属于()学习任务。
选项:
A:回归
B:分类
C:其余选项都不是
D:聚类
答案: 【回归

2、单选题:
在学习过程中,X表示数据集,Y是所有标记的集合,也称为( )。
选项:
A:属性集合
B:函数
C:样本集合
D:输出空间
答案: 【输出空间

3、单选题:
机器学习算法在学习过程中可能获得多个不同的模型,在解决“什么样的模型更好”这一问题时遵循“若有多个假设与观察一致,则选最简单的那个”,即( )原则。
选项:
A:奥卡姆剃刀
B:迪米特法则
C:没有免费的午餐
D:里氏替换
答案: 【奥卡姆剃刀

4、单选题:
机器学习是整个人工智能的核心,机器学习算法的特征之一就是( )。
选项:
A:数据
B:特征
C:模型
D:类别
答案: 【模型

5、单选题:
模型的泛化能力是指
选项:
A:适用于验证集样本的能力
B:适用于测试集样本的能力
C:适用于新样本的能力
D:适用于训练集样本的能力
答案: 【适用于新样本的能力

6、多选题:
下列关于学习算法的说法正确的是
选项:
A:学习算法必须有某种偏好,才能产出它认为“正确”的模型
B:在某些问题上表现好的学习算法,在另一些问题上却可能不尽人意
C:学习算法自身的归纳偏好与问题是否相配通常并不起决定性的作用
D:要谈论算法的相对优劣,必须要针对具体的学习问题
答案: 【学习算法必须有某种偏好,才能产出它认为“正确”的模型;
在某些问题上表现好的学习算法,在另一些问题上却可能不尽人意;
要谈论算法的相对优劣,必须要针对具体的学习问题

7、多选题:
获得假设(模型)空间时,从特殊到一般的过程属于
选项:
A:特化
B:泛化
C:演绎
D:归纳
答案: 【泛化;
归纳

8、多选题:
机器学习可以应用在下列哪些领域()
选项:
A:商业营销
B:搜索引擎
C:自动驾驶汽车
D:天气预报
答案: 【商业营销;
搜索引擎;
自动驾驶汽车;
天气预报

9、多选题:
根据训练数据是否拥有标记信息,学习任务可以分为()。
选项:
A:聚类
B:监督
C:分类
D:回归
E:无监督
F:半监督
答案: 【监督;
无监督;
半监督

10、判断题:
演绎是从一般到特殊的"特化"过程,即从基础原理推演出具体状况
选项:
A:错
B:对
答案: 【

11、判断题:
分类预测的是离散值
选项:
A:错
B:对
答案: 【

12、判断题:
分类和回归是无监督学习
选项:
A:对
B:错
答案: 【

13、判断题:
奥卡姆剃刀原则:即“若有多个假设与观察一致,选最简单的一个”。
选项:
A:对
B:错
答案: 【

14、判断题:
实际应用中,“一个模型肯定比另一个模型具有更强的泛化能力”的这种情况是不存在的。
选项:
A:错
B:对
答案: 【

15、判断题:
机器学习的目标就是获得与训练集一致的假设。
选项:
A:对
B:错
答案: 【

第二章 单元测试

1、判断题:
测试性能随着测试集的变化而变化
选项:
A:错
B:对
答案: 【

2、单选题:
以下关于回归的说法中,不正确的是()。
选项:
A:回归也是一种分类
B:回归是根据历史数据拟合以函数将属性集映射到相应的值集
C:回归的目标属性是离散的
D:回归是一种预测建模任务
答案: 【回归的目标属性是离散的

3、单选题:
下列关于查全率和查准率的说法哪种正确()。
选项:
A:查全率和查准率存在着互逆关系
B:好的模型可以做到查全率和查准率都达到100%
C:查全率和查准率成正比
D:查全率和查准率成反比
答案: 【查全率和查准率存在着互逆关系

4、单选题:
关于性能比较和模型选择,下列说法正确的是()。
选项:
A:测试性能等于网络的泛化性能
B:相同的参数的机器学习算法在同一测试集下多次运行结果相同
C:模型的选择可以使用直接选取相应评估方法在相应度量下比较大小的方法
D:测试性能随着测试集的变化而变化
答案: 【测试性能随着测试集的变化而变化

5、单选题:
模型的评估方法不包括()。
选项:
A:交叉验证法
B:留出法
C:计分法
D:自助法
答案: 【计分法

6、单选题:
模型评估方法中留出法的缺点是()。
选项:
A:只能得到一个评估值。
B:在数据集比较大的时候,训练M个模型的计算开销可能是难以忍受的
C:改变了初始数据集的分布,引入估计偏差
D:样本利用率低
答案: 【只能得到一个评估值。

7、多选题:
选择模型的依据包括()。
选项:
A:泛化性能
B:时间开销
C:存储开销
D:可解释性
答案: 【泛化性能;
时间开销;
存储开销;
可解释性

8、多选题:
以下哪些方法可以用于单个学习器性能的比较()。
选项:
A:McNemar检验
B:t-检验
C:二项检验
D:Friedman检验
答案: 【t-检验;
二项检验

9、多选题:
模型的泛化性能由()决定。
选项:
A:学习任务本身的难度
B:数据集的划分
C:数据的充分性
D:学习算法的能力
答案: 【学习任务本身的难度;
数据的充分性;
学习算法的能力

10、多选题:
解决过拟合的方案包括()。
选项:
A:增加模型参数,调高模型复杂度
B:选择合适的迭代次数停止模型的学习
C:引入正则项
D:为模型添加其他特征项
答案: 【选择合适的迭代次数停止模型的学习;
引入正则项

11、多选题:
以下哪些是可能导致模型过拟合的原因()
选项:
A:学习迭代次数过多
B:模型学习到了样本的一般性质
C:训练集数量级和模型复杂度不匹配,训练集的数量级小于模型的复杂度
D:训练集和测试集特征分布不一致
答案: 【学习迭代次数过多;
训练集数量级和模型复杂度不匹配,训练集的数量级小于模型的复杂度;
训练集和测试集特征分布不一致

12、判断题:
过拟合不可以彻底避免。
选项:
A:错
B:对
答案: 【

13、判断题:
回归任务最常用的性能度量是“查准率和查全率”
选项:
A:错
B:对
答案: 【

14、判断题:
训练数据较少时更容易发生欠拟合
选项:
A:错
B:对
答案: 【

15、判断题:
方差度量了学习算法期望预测与真实结果的偏离程度
选项:
A:错
B:对
答案: 【

发表评论

电子邮件地址不会被公开。 必填项已用*标注