Машинное обучение вики
Advertisement
Sleep
Это незавершённая статья
Автор, вероятно, переобучился и отправился спать.
Вы можете помочь, экстраполировав местную информацию.

TPR и FPR

Рассмотрим случай бинарной классификации (). Пусть - классификатор который оценивает вероятность принадлежности объекта к положительному классу. Рассмотрим некоторый порог по которому будем строить предсказание. Отнесем объект x к положительному классу если , иначе к отрицательному. Построим для него матрицу ошибок и найдем значения TP, TN, FP, FN, и введем две метрики:

  • True positive rate.
  • False positive rate.

TPR полностью совпадает с полнотой, и показывает долю верно предсказанных классов у объектов относящихся к положительному классу.

FPR — это доля неправильно угаданных классов среди объектов отрицательного класса.

Кривая ошибок (ROC-curve)

Так как TPR и FPR считались для фиксированного порога то их можно представить в виде функций с параметром : . При этом обе функции монотонно возрастают от до , а значит определена функция:

Roccurves

ROC-кривые для разных методов

(более формально: ).

Которая называется рабочей характеристикой приемника (reciever operation characteristic, ROC). График функции называется ROC-кривой или кривой или кривой ошибок.

  • Всегда начинается в (0, 0) и заканчивается в (1, 1).
  • Как правило у хорошего классификатора кривая лежит по большей части, либо целиком выше линии y=x. Это связано с тем что при хорошей классификации надо получать максимальный TPR при минимальном FPR.

AUC-ROC

Как уже было сказано выше чем больший мы можем получить TPR при меньшем FPR тем лучше. Поэтому можем ввести следующую метрику оценивающую качество работы классификатора:

.

Которая является площадью под графиком ROC-кривой (area under curve, AUC).

Методы построения

Todo

лень...

Advertisement