Машинное обучение вики
Advertisement

Метод минимизации эмпирического риска[]

Метод минимизации эмпирического риска (Empirical Risk Minimization) — общий подход к решению широкого класса задач обучения по прецедентам, включая задачи классификации и регрессии.

  1. Функция потерь характеризует величину отклонения ответа алгоритма от правильного ответа на произвольном объекте .
  2. Эмпирический риск — функционал качества, характеризующий среднюю ошибку алгоритма на обучающей выборке:

Замечание[]

По-честному, мы должны минимизировать следующий функционал:


Но так как нам не всегда известно, да и вычисление интегралов — трудоемкое дело, то мы заменяем этот интеграл фактически выборочным средним.

  1. Метод минимизации эмпирического риска заключается в том, чтобы в заданной модели алгоритмов найти алгоритм, доставляющий минимальное значение функционалу эмпирического риска:

Оценивание эмпирического риска[]

Китовослайд 19

Как правило, на тестовой выборке значение эмпирического риска будет больше, чем на обучающей выборке.

Оценить эмпирический риск на тестовой выборке можно с помощью:

  • выборки, которая не использовалась на обучении (валидационная выборка)
  • кросс-валидации
  • leave-one-out (собственно, разновидность кросс-валидации)

Источники:

http://www.machinelearning.ru/wiki/index.php?title=%D0%9C%D0%B8%D0%BD%D0%B8%D0%BC%D0%B8%D0%B7%D0%B0%D1%86%D0%B8%D1%8F_%D1%8D%D0%BC%D0%BF%D0%B8%D1%80%D0%B8%D1%87%D0%B5%D1%81%D0%BA%D0%BE%D0%B3%D0%BE_%D1%80%D0%B8%D1%81%D0%BA%D0%B0

http://www.machinelearning.ru/wiki/images/6/68/voron-ML-Lin.pdf

Advertisement