La estadística descriptiva
La estadística
descriptiva es una ciencia que analiza series de datos (por ejemplo, edad
de una población, altura de los estudiantes de una escuela, temperatura en los
meses de verano, etc) y trata de extraer conclusiones sobre el comportamiento
de estas variables.
Las variables pueden
ser de dos tipos:
- · Variables cualitativas o atributos: no se pueden medir numéricamente (por ejemplo: nacionalidad, color de la piel, sexo).
- · Variables cuantitativas: tienen valor numérico (edad, precio de un producto, ingresos anuales).
Las variables también
se pueden clasificar en:
- · Variables unidimensionales: sólo recogen información sobre una característica (por ejemplo: edad de los alumnos de una clase).
- · Variables bidimensionales: recogen información sobre dos características de la población (por ejemplo: edad y altura de los alumnos de una clase).
- · Variables pluridimensionales: recogen información sobre tres o más características (por ejemplo: edad, altura y peso de los alumnos de una clase).
Por
su parte, las variables cuantitativas se pueden clasificar en
discretas y continuas:
- · Discretas: sólo pueden tomar valores enteros (1, 2, 8, -4, etc.). Por ejemplo: número de hermanos (puede ser 1, 2, 3...., etc., pero, por ejemplo, nunca podrá ser 3.45).
- · Continuas: pueden tomar cualquier valor real dentro de un intervalo. Por ejemplo, la velocidad de un vehículo puede ser 80.3 km/h, 94.57 km/h...etc.
Elementos de la
estadística descriptiva
Medidas
de tendencia central
|
Son puntos en una distribución obtenida, los
valores medios o centrales de ésta y nos ayudan a ubicarla dentro de la
escala de medición de la variable analizada. Las principales medidas de
tendencia central son tres: la moda, la mediana y la media.
Son útiles para encontrar indicadores
representativos de un colectivo de datos.
· Media Aritmética: Se define como el promedio o
media de un conjunto de observaciones o puntuaciones.
· Moda: En una serie de puntuaciones se denomina
moda a la observación que se presenta con mayor frecuencia.
· Mediana: Se localiza en el centro de un conjunto
de observaciones presentadas en una serie ordenada de datos.
|
Correlación
entre variables
|
La
correlación estadística constituye una técnica estadística que nos indica si
dos variables están relacionadas o no.
La
correlación puede decir algo acerca de la relación entre las variables.
Se utiliza para entender:
·
Si
la relación es positiva o negativa
·
La
fuerza de la relación.
La
correlación es una herramienta poderosa que brinda piezas vitales de
información.
|
Pruebas de diferencias entre
medidas
|
|
T
de Student
|
Es
una prueba estadística para evaluar si dos grupos entre sí de manera
significativa respecto a sus medidas en una variable.
Se simboliza: t
Hipótesis: de diferencia entre dos
grupos. La hipótesis de investigación propone que los grupos difiere entre si
la manera significativa y la hipótesis nula plantea que los grupos no
difieren significativamente.
Variables: la comparación se realiza
sobre una variable (regularmente y de manera teórica: dependiente. Si hay
diferentes variables, se efectuaran varias pruebas t (una por cada variable)
y la razón que motiva la creación de los grupos puede ser una variable
independiente.
Esta
prueba se basa en una distribución muestral o poblacional de diferencia de
medias conocida como distribución t de Student que se identifica por los
grados de libertad, los cuales constituyen el número de maneras en que los
datos pueden variar libremente.
En
esta prueba estadística se exige dependencia entre ambas muestras, en las que
hay dos momentos uno antes y otro después. Con ello se da a entender que en
el primer período, las observaciones servirán de control o testigo, para
conocer los cambios que se susciten después de aplicar una variable
experimental.
Con
la prueba t se comparan las medias y las desviaciones estándar de grupo de
datos y se determina si entre esos parámetros las diferencias son
estadísticamente significativas o si sólo son diferencias aleatorias.
|
Análisis
de varianza
|
Es
una prueba estadística para analizar si más de dos grupos difieren significativamente
entre sí en cuanto a sus medidas y varianzas. La prueba t se aplica para dos
grupos y el análisis de varianza unidireccional se usa para tres, cuatro o
más grupos.
Permite
determinar si diferentes tratamientos muestran diferencias significativas o
por el contrario puede suponerse que sus medias poblacionales no difieren.
Es
un método que permite comparar varias medias en diversas situaciones; muy
ligado, por tanto, al diseño de experimentos y, de alguna manera, es la base
del análisis multivariante.
|