Дисперсия

Дисперсия — числовая характеристика разброса случайной величины вокруг её математического ожидания. Она показывает, насколько значения величины в среднем «рассеяны» относительно среднего значения. Формально дисперсия определяется как математическое ожидание квадрата отклонения случайной величины X от её среднего μ, что записывается как σ2=E[(Xμ)2]\sigma^2 = E\big[(X-\mu)^2\big]. Дисперсия неотрицательна: ноль достигается только в случае детерминированной величины, у которой все наблюдения равны одному значению. Эта характеристика важна тем, что она учитывает квадраты отклонений, поэтому большие отклонения дают существенно больший вклад в итоговую оценку разброса, чем мелкие.

Дисперсия широко применяется в статистике, теории вероятностей, прикладных науках и инженерии. Она используется при оценке надежности измерений, при анализе случайных процессов и в задачах оптимизации. На практике часто используют среднеквадратическое отклонение — корень квадратный из дисперсии, поскольку оно имеет те же единицы измерения, что и исходные данные. Для вычисления дисперсии полезна формула, выражающая дисперсию через математическое ожидание квадрата и квадрат математического ожидания: σ2=E(X2)(E(X))2\sigma^2 = E(X^2) - (E(X))^2. В выборочном анализе при оценке дисперсии по конечной выборке n применяется несмещённая оценка, в которой сумма квадратов отклонений нормируется на n−1, а не на n: s2=1n1i=1n(xix)2s^2 = \frac{1}{n-1}\sum_{i=1}^n (x_i-\overline{x})^2.

Пример 1: Пусть случайная величина принимает значения 1, 2 и 3 с равными вероятностями. Среднее значение равно 2, а дисперсия рассчитывается по определению как средний квадрат отклонений от 2 (σ2=E[(Xμ)2]\sigma^2 = E\big[(X-\mu)^2\big]), что даёт числовую оценку разброса. Пример 2: На практике при обработке эксперимента с выборкой из n измерений используют формулу выборочной дисперсии (s2=1n1i=1n(xix)2s^2 = \frac{1}{n-1}\sum_{i=1}^n (x_i-\overline{x})^2), чтобы получить несмещённую оценку генеральной дисперсии. Для иллюстрации распределения и визуального представления разброса можно добавить график частот или плотности — например, смоделированное гистограммное изображение {IMAGE_0} или график функции плотности {IMAGE_1}.