Сумма квадратов отклонений - это фундаментальное понятие в статистике, анализе данных и машинном обучении, которое показывает меру разброса данных относительно некоторой точки.
Содержание
Основное определение
Сумма квадратов отклонений (SS - Sum of Squares) вычисляется по формуле:
Тип отклонения | Формула |
От среднего значения | SS = Σ(xᵢ - x̄)² |
От произвольной точки a | SS = Σ(xᵢ - a)² |
Где применяется сумма квадратов отклонений
- Расчет дисперсии и стандартного отклонения
- Метод наименьших квадратов в регрессионном анализе
- Анализ вариации (ANOVA)
- Кластерный анализ
- Оценка точности моделей
Свойства суммы квадратов отклонений
- Всегда неотрицательна (SS ≥ 0)
- Минимальна при отклонении от среднего
- Чувствительна к выбросам
- Растет с увеличением объема данных
Пример расчета
Данные (xᵢ) | Отклонение от среднего (xᵢ - x̄) | Квадрат отклонения |
2 | -2 | 4 |
4 | 0 | 0 |
6 | 2 | 4 |
Сумма квадратов отклонений | 8 |
Разложение суммы квадратов
В анализе вариации сумма квадратов отклонений раскладывается на компоненты:
- SStotal - общая сумма квадратов
- SSbetween - сумма квадратов между группами
- SSwithin - сумма квадратов внутри групп
Сумма квадратов отклонений является ключевой мерой изменчивости данных и широко применяется в статистическом анализе для оценки разброса и построения моделей.