机器学习 | 模型评估与选择之性能度量

性能度量是衡量模型泛化能力的评价标准,反映了任务需求;使用不同的性能度量往往会导致不同的评判结果。 回归任务最常用的性能度量是“均方误差”: 一般式子 对于数据分布D和概率密度函数p(.) 均方误差可描述成: 对于分类任务,错误率和精度是最常用的两种性能度量: 错误率:分错的样本占样本总数的比例 精度:分对的样本占样本总数的比例 分类错误率: 分类精度: 一般式子 对于数据分布D和概率密度

- 阅读全文 -

机器学习 | 模型评估与选择之评估方法

基本概念 错误率:分类错误的样本占样本总数的比例 精度:分类正确的样本占样本总数的比例,即精度=1-错误率。 过拟合:由于学习能力过于强大,以至于把训练样本所包含的不太一般的特性都学到了。 欠拟合:由于学习能力太低下,以至于把训练样本所包含一般的特性没学好。 对数据集D进行适当的处理,从中产生训练集S和测试集T。 留一法:与交叉验证法相比,省去第五步,每个样本就是一个最小的子集,不可分,可以省

- 阅读全文 -