Метод минимизации эмпирического риска[]
Метод минимизации эмпирического риска (Empirical Risk Minimization) — общий подход к решению широкого класса задач обучения по прецедентам, включая задачи классификации и регрессии.
- Функция потерь характеризует величину отклонения ответа алгоритма от правильного ответа на произвольном объекте .
- Эмпирический риск — функционал качества, характеризующий среднюю ошибку алгоритма на обучающей выборке:
Замечание[]
По-честному, мы должны минимизировать следующий функционал:
Но так как нам не всегда известно, да и вычисление интегралов — трудоемкое дело, то мы заменяем этот интеграл фактически выборочным средним.
- Метод минимизации эмпирического риска заключается в том, чтобы в заданной модели алгоритмов найти алгоритм, доставляющий минимальное значение функционалу эмпирического риска:
Оценивание эмпирического риска[]
Как правило, на тестовой выборке значение эмпирического риска будет больше, чем на обучающей выборке.
Оценить эмпирический риск на тестовой выборке можно с помощью:
- выборки, которая не использовалась на обучении (валидационная выборка)
- кросс-валидации
- leave-one-out (собственно, разновидность кросс-валидации)
Источники:
http://www.machinelearning.ru/wiki/images/6/68/voron-ML-Lin.pdf