Короче говоря...[]
Одним из непараметрических способов оценки плотности распределения является ядерное сглаживание (KDE). В отличие от метода гистограмм блоки (окна), по которым оценивается распределение, не фиксированы, а центрируются по точке-представителю.
Общая формула KDE (Kernel Density Estimation):
, где — ядро, — ширина окна. Это два наиважнейших параметра метода. Выбор ядра в основном влияет на гладкость итогового распределения, но на точность аппроксимации намного большее влияние оказывает ширина окна, поэтому подбор данного параметра является важной и не всегда тривиальной задачей (прибегают к кросс-валидации, различным эвристикам или динамическому выбору ширины окна). Основное правило: чем плотнее выборочное распределение, тем уже должно быть окно.Пример ядра:
— tophat-ядро. Одно из простейших ядер, но не учитывает расстояние между объектами, а также итоговое распределение не будет являться непрерывным.Говорят, что оценка
по методу KDE состоятельна, еслиДостаточные условия состоятельности:
- Примеры ядер, пояснения). — ядро (
Разумеется, имеются обобщения на многомерный случай.
С чего я это взял?[]
- Мои конспекты
- Презентейшн