Desviación estándar

Keywords: Desviación estándar, 1894, Dispersión, Estadística, Función raíz, Lista de artículos relacionados con la estadística, Media aritmética, Medida, Precisión

En probabilidad y estadística, la desviación estándar es la medida más común de dispersión. Dicho de manera sencilla, mide qué tan dispersos están los valores en una colección de datos.

La desviación estándar está definida como la raíz cuadrada de la varianza. Se define de esta manera para darnos una medida de la dispersión que es (1) un número no negativo y (2) tiene las mismas unidades que los datos.

El término desviación estándar fue introducido en estadística por Karl Pearson en 1894.

Tabla de contenidos

Interpretación y aplicación

La desviación estándar es una medida del grado de dispersión de los datos del valor promedio. Dicho de otra manera, la desviación estándar es simplemente el "promedio" o variación esperada con respecto de la media aritmética.

Una desviación estándar grande indica que los puntos están lejos de la media y una desviación pequeña indica que los datos están agrupados cerca de la media.

Por ejemplo, las tres muestras (0, 0, 14, 14), (0, 6, 8, 14) y (6, 6, 8, 8) cada una tiene una media de 7. Sus desviaciones estándar son 7, 5 y 1, respectivamente. La tercera muestra tiene una desviación mucho menor que las otras dos porque sus valores están más cerca de 7.

La desviación estándar puede ser interpretada como una medida de incertidumbre. La desviación estándar de un grupo repetido de medidas nos da la precisión de éstas. Cuando se va a determinar si un grupo de medidas está de acuerdo con el modelo teórico, la desviación estándar de esas medidas es de vital importancia: si la media de las medidas está demasiado alejada de la predicción (con la distancia medida en desviaciones estándar), entonces consideramos que las medidas contradicen la teoría. Esto es de esperarse ya que las mediciones caen fuera del rango de valores de los cuales sería razonable esperar que ocurrieran si el modelo teórico fuera correcto.

Desglose

La desviación estándar (DS/DE), también conocida como desviación típica, es una medida de dispersión usada en estadística que nos dice cuánto tienden a alejarse los valores puntuales del promedio en una distribución. De hecho específicamente las desviación estándar es "el promedio de la distancia de cada punto respecto del promedio". Se suele representar por una S o con la letra sigma, \sigma^{}_{}.

La desviación estándar de un conjunto de datos es una medida de cuánto se desvían los datos de su media. Esta medida es más estable que el recorrido y toma en consideración el valor de cada dato.

Es posible calcular la desviación estándar como la raíz cuadrada de la integral

{\sigma}^2 = \int_{-\infty}^\infty {(x - \mu)}^2 f(x) dx

donde

\mu = \int_{-\infty}^\infty x f(x) dx
\sigma^2 = \lim_{n \to \infty} \frac{1}{n} \sum_{i=1}^n  \left( x_i - \overline{x} \right) ^ 2

Asi la varianza es la media de los cuadrados de las diferencias entre cada valor de la variable y la media aritmética de la distribución.

Aunque esta fórmula es correcta, en la práctica interesa realizar inferencias poblacionales, por lo que en el denominador en vez de n, se usa n-1 (Corrección de Bessel)

s^2 = \frac{ \sum_{i=1}^n \left( x_i - \overline{x} \right) ^ 2 }{n-1}

Tambien hay otra función más sencilla de realizar y con menos riesgo de tener equivocaciones:

s^2 = \frac{ \sum_{i=1}^n x_i^2 }{n-1} - \overline{x}^2

Ejemplo

Aquí se muestra cómo calcular la desviación estándar de un conjunto de datos. Los datos representan la edad de los miembros de un grupo de niños. { 5, 6, 8, 9 }

1. Calcular el promedio \overline{x}.

\overline{x}=\frac{1}{N}\sum_{i=1}^N x_i.

En este caso, N = 4 porque hay cuatro datos:

x_1 = 5\,\!
x_2 = 6\,\!
x_3 = 8\,\!
x_4 = 9\,\!
\overline{x}=\frac{1}{4}\sum_{i=1}^4 x_i       Sustituyendo N por 4
\overline{x}=\frac{1}{4} \left ( x_1 + x_2 + x_3 +x_4 \right )
\overline{x}=\frac{1}{4} \left ( 5 + 6 + 8 + 9 \right )
\overline{x}= 7   Este es el promedio.


2. Calcular la desviación estándar \sigma\,\!

\sigma = \sqrt{\frac{1}{N} \sum_{i=1}^N (x_i - \overline{x})^2}
\sigma = \sqrt{\frac{1}{4} \sum_{i=1}^4 (x_i - \overline{x})^2}       Sustityendo N por 4
\sigma = \sqrt{\frac{1}{4} \sum_{i=1}^4 (x_i - 7)^2}       Sustituyendo \overline{x} por 7
\sigma = \sqrt{\frac{1}{4} \left [ (x_1 - 7)^2 + (x_2 - 7)^2 + (x_3 - 7)^2 + (x_4 - 7)^2 \right ] }
\sigma = \sqrt{\frac{1}{4} \left [ (5 - 7)^2 + (6 - 7)^2 + (8 - 7)^2 + (9 - 7)^2 \right ] }
\sigma = \sqrt{\frac{1}{4} \left ( (-2)^2 + (-1)^2 + 1^2 + 2^2 \right ) }
\sigma = \sqrt{\frac{1}{4} \left ( 4 + 1 + 1 + 4 \right ) }
\sigma = \sqrt{\frac{10}{4}}
\sigma = 1.5811\,\!   Esta es la desviación estándar.

Ver también

Keywords: Desviación estándar, 1894, Dispersión, Estadística, Función raíz, Lista de artículos relacionados con la estadística, Media aritmética, Medida, Precisión