Машинное обучение вики
Advertisement

Короче говоря...[]

Одним из непараметрических способов оценки плотности распределения является ядерное сглаживание (KDE). В отличие от метода гистограмм блоки (окна), по которым оценивается распределение, не фиксированы, а центрируются по точке-представителю.

Общая формула KDE (Kernel Density Estimation): , где — ядро, — ширина окна. Это два наиважнейших параметра метода. Выбор ядра в основном влияет на гладкость итогового распределения, но на точность аппроксимации намного большее влияние оказывает ширина окна, поэтому подбор данного параметра является важной и не всегда тривиальной задачей (прибегают к кросс-валидации, различным эвристикам или динамическому выбору ширины окна). Основное правило: чем плотнее выборочное распределение, тем уже должно быть окно.

Пример ядра: — tophat-ядро. Одно из простейших ядер, но не учитывает расстояние между объектами, а также итоговое распределение не будет являться непрерывным.

Говорят, что оценка по методу KDE состоятельна, если

Достаточные условия состоятельности:

  1. — ядро (Примеры ядер, пояснения).

Разумеется, имеются обобщения на многомерный случай.

С чего я это взял?[]

  1. Мои конспекты
  2. Презентейшн
Advertisement