Это незавершённая статья Автор, вероятно, переобучился и отправился спать. Вы можете помочь, экстраполировав местную информацию. |
TPR и FPR
Рассмотрим случай бинарной классификации (). Пусть - классификатор который оценивает вероятность принадлежности объекта к положительному классу. Рассмотрим некоторый порог по которому будем строить предсказание. Отнесем объект x к положительному классу если , иначе к отрицательному. Построим для него матрицу ошибок и найдем значения TP, TN, FP, FN, и введем две метрики:
- True positive rate.
- False positive rate.
TPR полностью совпадает с полнотой, и показывает долю верно предсказанных классов у объектов относящихся к положительному классу.
FPR — это доля неправильно угаданных классов среди объектов отрицательного класса.
Кривая ошибок (ROC-curve)
Так как TPR и FPR считались для фиксированного порога то их можно представить в виде функций с параметром : . При этом обе функции монотонно возрастают от до , а значит определена функция:
(более формально: ).
Которая называется рабочей характеристикой приемника (reciever operation characteristic, ROC). График функции называется ROC-кривой или кривой или кривой ошибок.
- Всегда начинается в (0, 0) и заканчивается в (1, 1).
- Как правило у хорошего классификатора кривая лежит по большей части, либо целиком выше линии y=x. Это связано с тем что при хорошей классификации надо получать максимальный TPR при минимальном FPR.
AUC-ROC
Как уже было сказано выше чем больший мы можем получить TPR при меньшем FPR тем лучше. Поэтому можем ввести следующую метрику оценивающую качество работы классификатора:
.
Которая является площадью под графиком ROC-кривой (area under curve, AUC).
Методы построения
лень...