miércoles, 4 de noviembre de 2015

La estadística descriptiva


La estadística descriptiva es una ciencia que analiza series de datos (por ejemplo, edad de una población, altura de los estudiantes de una escuela, temperatura en los meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento de estas variables.


Las variables pueden ser de dos tipos:

  • ·         Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo).
  • ·         Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales).
Las variables también se pueden clasificar en:

  • ·       Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alumnos de una clase).
  • ·       Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase).
  • ·      Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase).
Por su parte, las variables cuantitativas se pueden clasificar en discretas y continuas:

  • ·         Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá ser 3.45).
  • ·        Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80.3 km/h, 94.57 km/h...etc.



Elementos de la estadística descriptiva



Medidas de tendencia central
Son puntos en una distribución obtenida, los valores medios o centrales de ésta y nos ayudan a ubicarla dentro de la escala de medición de la variable analizada. Las principales medidas de tendencia central son tres: la moda, la mediana y la media.
Son útiles para encontrar indicadores representativos de un colectivo de datos. 
·    Media Aritmética: Se define como el promedio o media de un conjunto de observaciones o puntuaciones. 
·        Moda: En una serie de puntuaciones se denomina moda a la observación que se presenta con mayor frecuencia.
·     Mediana: Se localiza en el centro de un conjunto de observaciones presentadas en una serie ordenada de datos.
Correlación entre variables
La correlación estadística constituye una técnica estadística que nos indica si dos variables están relacionadas o no.
La correlación puede decir algo acerca de la relación entre las variables. Se utiliza para entender:
·         Si la relación es positiva o negativa
·         La fuerza de la relación.
La correlación es una herramienta poderosa que brinda piezas vitales de información.
Pruebas de diferencias entre medidas
T de Student
Es una prueba estadística para evaluar si dos grupos entre sí de manera significativa respecto a sus medidas en una variable.
Se simboliza: t
Hipótesis: de diferencia entre dos grupos. La hipótesis de investigación propone que los grupos difiere entre si la manera significativa y la hipótesis nula plantea que los grupos no difieren significativamente.

Variables: la comparación se realiza sobre una variable (regularmente y de manera teórica: dependiente. Si hay diferentes variables, se efectuaran varias pruebas t (una por cada variable) y la razón que motiva la creación de los grupos puede ser una variable independiente.

Esta prueba se basa en una distribución muestral o poblacional de diferencia de medias conocida como distribución t de Student que se identifica por los grados de libertad, los cuales constituyen el número de maneras en que los datos pueden variar libremente.


En esta prueba estadística se exige dependencia entre ambas muestras, en las que hay dos momentos uno antes y otro después. Con ello se da a entender que en el primer período, las observaciones servirán de control o testigo, para conocer los cambios que se susciten después de aplicar una variable experimental.
Con la prueba t se comparan las medias y las desviaciones estándar de grupo de datos y se determina si entre esos parámetros las diferencias son estadísticamente significativas o si sólo son diferencias aleatorias.

Análisis de varianza
Es una prueba estadística para analizar si más de dos grupos difieren significativamente entre sí en cuanto a sus medidas y varianzas. La prueba t se aplica para dos grupos y el análisis de varianza unidireccional se usa para tres, cuatro o más grupos.

Permite determinar si diferentes tratamientos muestran diferencias significativas o por el contrario puede suponerse que sus medias poblacionales no difieren.

Es un método que permite comparar varias medias en diversas situaciones; muy ligado, por tanto, al diseño de experimentos y, de alguna manera, es la base del análisis multivariante.

No hay comentarios:

Publicar un comentario