第一章 单元测试

1、判断题:
回归和分类都是有监督学习问题。( )
选项:
A:对
B:错
答案: 【

2、判断题:
输出变量为有限个离散变量的预测问题是回归问题;输出变量为连续变量的预测问题是分类问题。( )
选项:
A:对
B:错
答案: 【

3、单选题:
关于“回归(Regression)”和“相关(Correlation)”,下列说法正确的是?注意:x 是自变量,y 是因变量。( )
选项:
A:回归在 x 和 y 之间是对称的,相关在 x 和 y 之间是非对称的
B:回归和相关在 x 和 y 之间都是非对称的
C:回归在 x 和 y 之间是非对称的,相关在 x 和 y 之间是互为对称的
D:回归和相关在 x 和 y 之间都是互为对称的
答案: 【回归在 x 和 y 之间是非对称的,相关在 x 和 y 之间是互为对称的

4、判断题:
如果一个经过训练的机器学习模型在测试集上达到 100% 的准确率,这就意味着该模型将在另外一个新的测试集上也能得到 100% 的准确率。( )
选项:
A:错
B:对
答案: 【

5、判断题:
机器学习学得的模型适用于新样本的能力,称为"泛化"能力,这是针对分类和回归等监督学习任务而言的,与聚类这样的无监督学习任务无关。( )
选项:
A:对
B:错
答案: 【

6、判断题:
机器学习时,我们通常假设样本空间中的全体样本都服从某个未知"分布",并且我们获得的每个样本都是独立地从这个分布上采样获得的。( )
选项:
A:对
B:错
答案: 【

7、判断题:
从归纳偏好一般性原则的角度看,"奥卡姆剃刀" (Occam's razor)准则与“大道至简”说的是相同的道理。( )
选项:
A:错
B:对
答案: 【

8、多选题:
以下方法或系统属于"符号主义" (symbolism)学习技术的是( )
选项:
A:支持向量机
B:"结构学习系统"
C:"基于逻辑的归纳学习系统“
D:"概念学习系统"
答案: 【"结构学习系统";
"基于逻辑的归纳学习系统“;
"概念学习系统"

9、多选题:
以下方法或技术属于统计学习范畴的是( )
选项:
A:Hopfield神经网络
B:感知机
C:核方法
D:支持向量机
答案: 【核方法;
支持向量机

10、判断题:
归纳学习相当于"从样例中学习",即从训练样例中归纳出学习结果。( )
选项:
A:对
B:错
答案: 【

第二章 单元测试

1、判断题:
回归问题和分类问题都有可能发生过拟合。( )
选项:
A:错
B:对
答案: 【

2、多选题:
对于k折交叉验证, 以下对k的说法正确的是 ( )
选项:
A:选择更大的k, 就会有更小的bias (因为训练集更加接近总数据集)
B:在选择k时, 要最小化数据集之间的方差
C:k越大, 不一定越好, 选择大的k会加大评估时间
D:k越大越好
答案: 【选择更大的k, 就会有更小的bias (因为训练集更加接近总数据集);
在选择k时, 要最小化数据集之间的方差;
k越大, 不一定越好, 选择大的k会加大评估时间

3、多选题:
小明参加Kaggle某项大数据竞赛,他的成绩在大赛排行榜上原本居于前20,后来他保持特征不变,对原来的模型做了1天的调参,将自己的模型在自己本地测试集上的准确率提升了3%,然后他信心满满地将新模型的预测结果更新到了大赛官网上,结果懊恼地发现自己的新模型在大赛官方的测试集上准确率反而下降了。对此,他的朋友们展开了讨论,下列说法正确的是( )
选项:
A:小明可以考虑一下,使用交叉验证来验证一下是否发生了过拟合
B:小明这个有可能是由于过拟合导致的
C:从机器学习理论的角度,这样的情况不应该发生,应该去找大赛组委会反应
D:小明应该乖乖使用默认的参数就行了,调参是不可能有收益的
答案: 【小明可以考虑一下,使用交叉验证来验证一下是否发生了过拟合;
小明这个有可能是由于过拟合导致的

4、多选题:
下列哪种方法可以用来减小过拟合?( )
选项:
A:更多的训练数据
B:L1 正则化
C:L2 正则化
D:减小模型的复杂度
答案: 【更多的训练数据;
L1 正则化;
L2 正则化;
减小模型的复杂度

5、单选题:
下列关于 bootstrap 说法正确的是?( )
选项:
A:从总的 N 个样本中,无放回地抽取 n 个样本(n < N)
B:从总的 N 个样本中,有放回地抽取 n 个样本(n < N)
C:从总的 M 个特征中,无放回地抽取 m 个特征(m < M)
D:从总的 M 个特征中,有放回地抽取 m 个特征(m < M)
答案: 【从总的 N 个样本中,有放回地抽取 n 个样本(n < N)

6、单选题:
评估完模型之后,发现模型存在高偏差(high bias),应该如何解决?( )
选项:
A:增加模型的特征数量
B:减少模型的特征数量
C:增加样本数量
答案: 【增加模型的特征数量

发表评论

电子邮件地址不会被公开。 必填项已用*标注