Búsqueda personalizada
Divestadística DICCIONARIO ESTADÍSTICO

En esta sección encontrarás la definición de términos usuales en Estadística. Periódicamente incluiremos nuevas entradas que irán completando el glosario. Si no localizas el término que buscas comunícalo a través del buzón de sugerencias y lo incorporaremos inmediatamente. Gracias por utilizar el diccionario Divestadística y contribuir a su actualización y exhaustividad.



C

  • Contraste de hipótesis: Test de hipótesis
  • Correlación: Medida de la relación existente entre dos variables. Su valor está comprendido entre –1 y 1. Si es negativo la relación entre las variables es inversa, es decir, a medida que aumentan los valores de una decrecen los de la otra. Si es positivo la asociación es directa, es decir, los valores de una variable aumentan con la otra. Un valor de cero indica ausencia de relación. Cuando las variables son continuas y tienen una relación lineal, el coeficiente de correlación lineal de Pearson es una medida de asociación adecuada. Cuando las variables no son continuas se utilizan otros coeficientes de correlación.

D

  • Desviación típica: Valor mayor o igual a cero que mide la dispersión de una característica de los individuos alrededor de la media del grupo. Los sujetos serán más parecidos u homogéneos entre sí cuanto más próxima a cero esté la desviación típica. Su unidad de medida coincide con la unidad de medida de la variable original. Es la raíz cuadrada de la varianza.
  • Diseño de experimentos: Método estadístico cuyo objetivo es estudiar cómo cambian los valores de una variable respuesta cuando se modifican los valores de una o varias variables independientes, denominadas factores experimentales. Un experimento bien diseñado puede ser el punto de partida para establecer relaciones causales entre las variables estudiadas.

E

  • Estadística: Ciencia que estudia los fenómenos aleatorios. Es un área de conocimiento específico de las Matemáticas que comenzó a desarrollarse a mediados del siglo XVII. Sus técnicas permiten resumir grandes cantidades de información, estudiar la relación entre variables, investigar la causa de algunos sucesos o predecir la evolución de un fenómeno en el tiempo y en el espacio, entre otras cosas.
  • Estimador: Valor numérico extraído de las observaciones de una muestra que se aproxima en mayor o menor medida al parámetro de la población sobre el que se quiere investigar. Así, la edad media de un grupo de individuos elegidos aleatoriamente de una población es un estimador de la verdadera edad media de la población.
  • Error alfa (α): Valor comprendido entre 0 y 1 que mide cuánto se equivoca el investigador al aceptar como verdadera la hipótesis alternativa de un test de hipótesis. Cuanto más próximo a cero esté, menor será el riesgo de establecer hipótesis falsas en la población de estudio. Su valor se fija a priori, antes de comenzar la investigación, para conocer el número de individuos necesario para llevar a cabo el estudio. Cuanto más pequeño sea el error alfa mayor será el tamaño de la muestra y, por tanto, más precisos serán los resultados. Habitualmente este error se fija en 0.05, aunque puede variar dependiendo del tipo de investigación.
  • Error beta (β): Valor comprendido entre 0 y 1 que mide cuánto se equivoca el investigador al aceptar como verdadera la hipótesis nula de un test de hipótesis. Cuanto más próximo a cero esté, menor será el riesgo de establecer hipótesis falsas en la población de estudio. Su valor se fija a priori, antes de comenzar la investigación, para conocer el número de individuos necesario para llevar a cabo el estudio. Cuanto más pequeño sea el error beta mayor será el tamaño de la muestra y, por tanto, más precisos serán los resultados. Habitualmente este error se fija en 0.20, aunque puede variar dependiendo del tipo de investigación.
  • Error estándar: Variabilidad del estimador cuando se obtiene a partir de muestras diferentes, resultando un valor distinto en cada muestra. El error estándar siempre es mayor que cero. Cuanto más pequeño sea mayor es la precisión de la estimación realizada.
  • Especificidad: Probabilidad de que una prueba diagnóstica proporcione un resultado negativo cuando el sujeto no está afectado por la enfermedad investigada. Lo ideal es que esta probabilidad sea 1 siempre que la prueba diagnóstica se aplique en el grupo de población libre de enfermedad. Sin embargo, no siempre es así. Cualquier prueba puede fallar mostrando un resultado positivo en un individuo sano. La especificidad es, por tanto, la capacidad de la prueba diagnóstica para detectar la ausencia de la enfermedad estudiada.

F

  • Falso negativo: Probabilidad de que una prueba diagnóstica proporcione un resultado negativo cuando el sujeto realmente tiene la enfermedad investigada. Es el valor complementario a la sensibilidad.
  • Falso positivo: Probabilidad de que una prueba diagnóstica proporcione un resultado positivo cuando el sujeto no está afectado por la enfermedad investigada. Es el valor complementario a la especificidad.

H

  • Hipótesis nula: Afirmación establecida por el investigador sobre la población de estudio cuando realiza un test o contraste de hipótesis. Esta hipótesis siempre se asume verdadera a menos que los datos de la muestra proporcionen evidencia de lo contrario. Se suele formular mediante una negación o una igualdad. Así, la hipótesis nula de un estudio sobre cirrosis hepática puede establecer que no existe relación entre el consumo habitual de alcohol y la cirrosis o, de forma equivalente, que el porcentaje de personas con cirrosis es igual en bebedores y no bebedores.
  • Hipótesis alternativa: Aseveración opuesta a la hipótesis nula en un test o contraste de hipótesis. Así, la hipótesis alternativa de un estudio sobre cirrosis hepática puede establecer que existe relación entre el consumo habitual de alcohol y la cirrosis o, de forma equivalente, que el porcentaje de personas con cirrosis es diferente en bebedores y no bebedores.

I

  • Inferencia estadística: Procedimiento que permiten extrapolar o generalizar a la población los resultados obtenidos en el análisis de una muestra. Las técnicas utilizadas para ello incluyen los intervalos de confianza y los tests de hipótesis.
  • Intervalo de confianza: Rango de valores que, con una cierta confianza, contiene al parámetro poblacional que se pretende conocer. El intervalo de confianza se construye a partir de la información de la muestra y es una de las herramientas utilizadas para extrapolar los resultados a la población.

M

  • Media: Valor numérico en torno al cual se sitúan los valores de una característica de los individuos. Es un representante del grupo de sujetos analizado.
  • Muestra: Grupo de individuos extraídos aleatoriamente de la población de estudio. La información proporcionada por estos sujetos se almacena en una base de datos para analizarla posteriormente. Los resultados obtenidos en este análisis son una aproximación a lo que realmente ocurre en toda la población. La inferencia estadística permite extrapolar los resultados de la muestra a la población y conocer el error cometido en estas estimaciones.

N

  • Nivel de confianza (1-α): Probabilidad de que el intervalo de confianza obtenido a partir de los datos de la muestra contenga al parámetro de la población que se pretende estimar. Aunque puede tomar cualquier valor entre 0 y 1, el más usual es 0.95 (95%).
  • Nivel de significación (α): Error alfa.

P

  • Población: Todos los individuos sobre los que se desea realizar una investigación o estudio. Cuando la información necesaria para el estudio ha sido extraída de todos y cada uno de los individuos de la población se habla de censo de población. Si por el contrario no es posible acceder a todos los sujetos por falta de recursos se procede a tomar una muestra aleatoria de la población de estudio.
  • Potencia (1-β): Valor comprendido entre 0 y 1 complementario al error beta. Mide el grado de acierto del investigador cuando acepta como verdadera la hipótesis nula de un test de hipótesis. Su valor se fija a priori, antes de comenzar la investigación, para conocer el número de individuos necesario para llevar a cabo el estudio. Cuanto mayor sea la potencia, mayor será el tamaño de la muestra y, por tanto, más precisos serán los resultados obtenidos. Habitualmente este error se fija en 0.80, aunque puede variar dependiendo del tipo de investigación.
  • Probabilidad: Medida adimensional que cuantifica la ocurrencia de los fenómenos producidos por azar. Sus valores son números comprendidos entre 0 y 1. Cuando la probabilidad es cero, el suceso no ocurrirá nunca. Si la probabilidad es uno, ocurrirá con total certeza. Los valores intermedios miden el gradiente de certidumbre.
  • Prueba diagnóstica: Procedimiento destinado a detectar la presencia o ausencia de una enfermedad en el individuo. Su capacidad de discriminación está determinada por la sensibilidad y la especificidad, características propias de cada prueba o test diagnóstico.

R

  • Regresión: Técnicas estadísticas que permiten determinar la ecuación matemática que relaciona un efecto (variable dependiente o respuesta) con una o varias causas (variables independientes o predictoras).

S

  • Sensibilidad: Probabilidad de que una prueba diagnóstica proporcione un resultado positivo cuando el sujeto tiene realmente la enfermedad. Lo ideal es que esta probabilidad sea 1 siempre que la prueba diagnóstica se aplique en el grupo de población afectado por la enfermedad. Sin embargo, no siempre es así. Cualquier prueba puede fallar mostrando un resultado negativo en un individuo enfermo. La sensibilidad es, por tanto, la capacidad de la prueba diagnóstica para detectar la presencia de la enfermedad estudiada.

T

  • Tamaño de muestra: Número de sujetos necesario para llevar a cabo una investigación, de manera que los resultados obtenidos a partir de ellos se aproximen a los resultados que se hubieran obtenido al estudiar a toda la población. El error cometido en esa extrapolación de resultados es conocido y prefijado antes de comenzar la investigación. El tamaño de muestra será mayor cuanto más pequeño sea el error que se desee cometer.
  • Test de hipótesis: Técnica estadística utilizada para decidir si una afirmación establecida por el investigador sobre la población de estudio es compatible con los resultados observados en una muestra. Cualquier test de hipótesis se compone de una hipótesis nula, formulada en términos de igualdad o negación, y una hipótesis alternativa.
  • Test diagnóstico: Prueba diagnóstica

V

  • Valor P: Valor comprendido entre 0 y 1 que mide el grado de acuerdo entre la información que proporciona la muestra y la hipótesis nula del test de hipótesis. Cuanto más próximo a cero esté, menor será el acuerdo entre ambas. Así, la hipótesis nula será rechazada en favor de la alternativa siempre que el Valor P sea muy pequeño, inferior al nivel de significación preestablecido.
  • Valor predictivo negativo: Probabilidad de que un individuo no padezca la enfermedad cuando la prueba diagnóstica aplicada proporcione un resultado negativo. Este valor depende tanto de la especificidad y de la proporción de falsos negativos de la prueba como del número de personas enfermas registrado en la población a la que pertenece el individuo. Por este motivo, el valor predictivo negativo puede ser diferente dependiendo del país o región en que se calcule, aún utilizando la misma prueba diagnóstica.
  • Valor predictivo positivo: Probabilidad de que un individuo padezca la enfermedad cuando la prueba diagnóstica aplicada proporcione un resultado positivo. Este valor depende tanto de la sensibilidad y de la proporción de falsos positivos de la prueba como del número de personas enfermas registrado en la población a la que pertenece el individuo. Por este motivo, el valor predictivo positivo puede ser diferente dependiendo del país o región en que se calcule, aún utilizando la misma prueba diagnóstica.
  • Variable: Cualquier característica de los individuos que componen la muestra que toma un valor diferente para cada uno de ellos. La edad y el sexo son variables habituales en muchas investigaciones.
  • Variable cualitativa: Característica que recoge una cualidad de los individuos de la muestra. Una variable cualitativa no puede medirse con un instrumento ni lleva asociada una unidad de medida. La gravedad de un accidente es una variable cualitativa ordinal, ya que registra una cualidad que pueden ordenarse de forma natural de menor a mayor severidad. El sexo, en cambio, es una variable cualitativa nominal porque sus categorías, masculino y femenino, no tienen un orden natural preestablecido.
  • Variable cuantitativa: Característica de los individuos de la muestra que puede medirse con un instrumento y lleva asociada una unidad de medida. El peso es una variable cuantitativa, ya que puede medirse con una báscula y su unidad de medida es el gramo. Además, esta variable es continua, ya que el valor del peso asignado a cada individuo puede tener tantos decimales como admita la precisión de la báscula. Otras variables cuantitativas, como el número de hijos, se denominan discretas porque sus valores solo pueden ser números enteros, sin decimales.
  • Varianza: Valor mayor o igual a cero que mide la dispersión de una característica de los individuos alrededor de la media del grupo. Los sujetos serán más parecidos u homogéneos entre sí cuanto más próxima a cero esté la varianza. Su unidad de medida es la unidad de medida de la variable original elevada al cuadrado. Su valor coincide con el cuadrado de la desviación típica.