机器学习 | 模型评估与选择之性能度量
性能度量是衡量模型泛化能力的评价标准,反映了任务需求;使用不同的性能度量往往会导致不同的评判结果。回归任务最常用的性能度量是“均方误差”:<div align=center></div>一般式子对于数据分布D和概率密度函数p(.)均方误差可描述成:<div align=center></div>对于分类任务,错误率和精度是最常用的两种性能度量:错误率
性能度量是衡量模型泛化能力的评价标准,反映了任务需求;使用不同的性能度量往往会导致不同的评判结果。回归任务最常用的性能度量是“均方误差”:<div align=center></div>一般式子对于数据分布D和概率密度函数p(.)均方误差可描述成:<div align=center></div>对于分类任务,错误率和精度是最常用的两种性能度量:错误率
基本概念错误率:分类错误的样本占样本总数的比例精度:分类正确的样本占样本总数的比例,即精度=1-错误率。过拟合:由于学习能力过于强大,以至于把训练样本所包含的不太一般的特性都学到了。欠拟合:由于学习能力太低下,以至于把训练样本所包含一般的特性没学好。对数据集D进行适当的处理,从中产生训练集S和测试集T。<div align=center></div><div alig