Título general: : Sesiones clínicas del Servicio de Análisis Clínicos del Hospital Universitario de Getafe

Introducción

La estadística es la ciencia que se ocupa de la recolección, agrupación, presentación, análisis e interpretación de datos. Concretamente el laboratorio es uno de los orígenes más potente en la generación de datos de un hospital, ya que por cada analítica se obtienen decenas de datos, por lo tanto la Estadística será una herramienta muy útil en la gestión de estos. ¿Dónde podemos encontrarla? Se encuentra en continuamente: en la simple información de los resultados, como puede ser un hemograma, agrupando datos por poblaciones celulares, calculando volúmenes medios, porcentajes, gráficos poblacionales, etc, también en la sección de Gestión de la Calidad, con todos los indicadores de calidad se poden analizar los datos de laboratorio viendo por ejemplo que plantas remiten muestras más hemolizadas, o desde donde se piden más cantidad de cierto analito, etc.

La Estadística se divide en 2 partes principales:

La Descriptiva, que se encarga de recoger, ordenar, analizar y mostrar los datos, por lo que es el primer paso en la Estadística. En el laboratorio, como ya hemos comentado, los hemogramas son un claro ejemplo, aunque también puede verse en los controles de calidad, con las gráficas de Levey-Jennings.

La segunda parte, es la Inferencia Estadística, que trata estos datos recogidos y organizados para llegar a conclusiones o toma de decisiones futuras. Un ejemplo son la regresiones que realizan los analizadores a partir de la curva de calibración, o los estudios que se realizan comparando métodos, etc.

Descriptiva

Dentro de la Descriptiva es necesario definir algunos conceptos ya mencionados, como:

Población, que se trata del conjunto completo de individuos al cual se quiere posteriormente realizar un estudio, estas poblaciones pueden ser finitas, aquellas que son fáciles de cuantificar, o infinitas, aquellas que son muy difíciles de medir, como los pacientes actuales de nefrología del Hospital o todos los pacientes de atención primaria de todas España, respectivamente.

La muestra es un grupo reducido de individuos o datos, a modo de representación para el resto de población, de esta forma el análisis es mucho más sencillo. Además hay que tener en cuenta que cuanto más grande es la muestra más representativa, pero también menos útil, luego lo oportuno es llegar al equilibrio entre representatividad y versatilidad.

Los parámetros, son los índices descriptivos que resumen la información de una población, como por ejemplo la media de hematíes por µL en una muestra de orina, para muestras se denominan, estadísticos.

Por último, variable, que es cada característica o aspecto que se estudia de una población, pudiendo ser cualitativa también denominada categórica, que se dividen en ordinales o nominales, y cuantitativa, que son discretas o continuas. Ejemplo de esto puede ser, en el caso de las orinas, los nitritos positivos o negativos, es una variable categórica nominal binaria, ya que solo toma valores de sí o no.

Los índices descriptivos, se clasifican en basados en momentos o en ordenación:

Basados en momentos, donde se toman todos los valores de la variable, de manera que se van a ver afectados por valores extremos:

En primer lugar, la media, que es un índice de tendencia central, que informa del centro de gravedad de la distribución de los datos. La más habitual es la media aritmética, pero también existe otras como la media geométrica, aplicada en medidas con variables exponenciales.

Como medidas de dispersión absoluta existen la varianza, que informa de la distancia entre cada valor y la media, y la desviación estándar, que aporta la misma información que la varianza pero con unidades acordes a la variable luego es más sencilla de interpretar.

En cuanto a las de dispersión relativa, se tiene el coeficiente de variación, el cual es el cociente entre desviación y media en porcentaje, obteniéndose un valor adimensional sencillo de comparar entre variables con distintas unidades.

Basados en ordenaciones, que se denominan así ya que el orden de los valores influye en ellos.

Primero los de tendencia central, como son mediana y moda, que indican el valor central de la distribución y valor más frecuente, respectivamente, luego son muy útiles para distribuciones asimétricas.

Por otro lado, los índices de posición, son los percentiles cuartiles, deciles, etc, que contienen los valores dispuestos en los cuantiles en los que se ha dividido la muestra, y los índices de dispersión por ordenación son el rango intercuartílico, diferencia entre tercer cuartil y el primer cuartil, y el recorrido, resta entre el valor máximo menos el mínimo.

Por último, los índices de forma son comunes, y son el de asimetría que mide hacia qué sentido se ha desviado la simetría de la distribución de la muestra, y el de curtosis o apuntalamiento el cual indica lo concentrados en la media o distribuidos hacia las colas que están los datos y por lo tanto mayor o menor recorrido o amplitud.

stat01

Representación gráfica

Otra de las partes más importantes de la estadística descriptiva es la representación gráfica de los datos o variables, ya que nos dará mucha información de un simple vistazo.

Comenzando por el diagrama de sectores, habitual en variables categóricas, para describir frecuencias en porcentaje por categorías. De uso similar es el diagrama de barras, salvo que estas no se basaran en porcentajes sino en frecuencias absolutas, aunque también puede usarse en frecuencias relativas.

El histograma es uno de los gráficos más utilizados en representación de variables continuas, ya que se representa, intervalos en abscisas y frecuencias absolutas en ordenadas, de manera que la superficie de la barra informa de la frecuencia de ese intervalo, además suele informarnos de la normalidad de los datos. Al añadirle una línea que una los puntos centrales de la parte superior de las barra, generamos polígono de frecuencias, para mayor información.

Otra de las representaciones usadas es la de boxplot o diagramas de caja, que aporta información sobre asimetría, tendencia central y valores alejados. También como grafico de visualización de normalidad se tiene el grafico de tallo y hojas, en el cual se representando todos los datos por primer digito como tallo y segundo como hojas, repitiendo este las veces que se repita, de esta manera podemos observar intervalos, con frecuencias y valores a la vez.

Y por último, un gráfico usado muy frecuentemente, el de dispersión o nube de puntos en el cual se relacionan dos variables cuantitativas, y será la base de la representación de regresiones.

stat02

Inferencia

La segunda parte de la estadística es la inferencia, como ya se ha mencionado se ocupará de analizar los datos para realizar decisiones futuras o sacar conclusiones de los datos que se tienen.

Lo primero que hay que conocer antes de comenzar con los contrastes de hipótesis es qué es una variable aleatoria y cuáles son las distintas distribuciones que sigue: Una variable aleatoria, es como se ha comentado una característica medible, que toma valores con una probabilidad dada y esta probabilidad va a tener una media que se representa como esperanza matemática o valor esperado y una desviación de ese valor, generándose así las distintas distribuciones, dependiendo si son discretas o continuas.

Las discretas pueden seguir las siguientes distribuciones:

Binomial: Para experimentos con respuestas binarias, normalmente clasificadas en éxito o fracaso. Siempre aplicado a poblaciones finitas con reemplazo. Se toma el número de éxitos como k, n número de pruebas y p la probabilidad de éxito.

Bernoulli: Es un caso particular de la binomial, en la cual n, numero de experimentos es 1.

Poisson: Se trata de una forma límite de la binomial, en la que el evento observado es un caso raro, por lo tanto p es muy pequeño, luego puede aproximarse a la binomial, en caso de n muy grande.

Hipergeométrica: En este caso, no existe reemplazo en el muestreo, en el caso de n grande este reemplazo no afectará a la distribución y por lo tanto se aproximará a una binomial.

En el caso de variables continuas, la distribución estándar será la normal, definida por media y desviación estándar, y la distribución más importante de la estadística, ya que casi todas las medidas de datos continuos siguen esta distribución. Es característica por ser, simétrica, mesocúrtica y unimodal.

Otras distribuciones asociadas a la normal son:

Chi-cuadrado: para pruebas de bondad de ajuste, independencia y estimación de varianzas.

T-student: como normal tipificada, habitual en contraste de hipótesis.

F-Snedecor: para comparación de varianzas, ANOVA.

Estas distribuciones surgen de operar con la normal, para la estimación de parámetros poblacionales, y también como aplicación de distintos test estadísticos.

Contraste de hipótesis

El contrate de hipótesis se define como la herramienta estadística que establece una hipótesis que se quiere contrastar, es decir, comparar. Para esto es necesario seguir unos pasos:

En primer lugar, establecer la hipótesis nula, que es aquella que se formula con intención de rechazarla, pero que va a ser aceptada si los datos no dice lo contrario.

Después, se formula la hipótesis alternativa, aquella que va a contradecir a la hipótesis nula, por lo tanto será aceptada cuando esta otra se rechace. Además esta va implicar el uso de datos estadísticos bilaterales o unilaterales, en el caso en el esta se formule dando diferencias en general, o que dicha diferencia sea en un sentido. Son más habituales las bilaterales.

Posteriormente, seleccionaríamos el nivel de significación, o sea la probabilidad de cometer error tipo 1, que se trata de rechazar la hipótesis nula cuando esta es verdadera, habitualmente establecida entre un 5 o un 1% según lo estricto que se desee ser. Es importante también conocer que el error tipo 2 es todo lo contrario, aceptarla cuando es falsa.

El siguiente paso es la elección del test estadístico correcto.

Y por último la toma de decisión, rechazar o aceptar hipótesis nula. Para ello se usa el valor de p también conocido por valor de significación, que es el valor mínimo de significación necesario para rechazar hipótesis nula o lo que es lo mismo, la probabilidad de que las diferencias encontradas sean debidas al azar. Por lo tanto, cuando este valor es menor o igual a la significación elegida se rechaza hipótesis nula ya que dicha probabilidad es muy pequeña, sin embargo si es mayor, se acepta.

La elección del test estadístico es un punto crítico y se realizará siguiendo unas pautas. Lo primero es reconocer que tipo de variable es, si es categórica, binaria o continua, posteriormente en aquellas continuas si es paramétrica, o no, o sea si sigue una distribución normal y cumple el supuesto de homocedasticidad, y por último conocer las variables exposición y respuesta. Este aspecto se resume en la tabla 2 de manera básica, ya que existen muchos otros, sobre todo para datos apareados.

stat03

Como se ha comentado ha de tenerse en cuenta para realizar dichos tests la comprobación de la normalidad de los datos y la homocedasticidad o homogeneidad de varianzas. La normalidad se comprueba mediante gráficos como histogramas, diagramas de normalidad, índices como el de asimetría o el de curtosis, y por ultimo con otros tests como son el de Kolmogorov-Smirnov o Shapiro-Wilks, para muestras pequeñas. Y la homocedasticidad con test como Cochran, Bartlett aunque el más habitual es el de Levene.

Evaluación de pruebas diagnósticas

Las pruebas diagnosticas tienen el fin de clasificar los pacientes en enfermos y no enfermos, y se selecciona aquellas pruebas diagnósticas más concluyentes y eficaces como Gold Standard. Para definirlas así, se evalúa su sensibilidad y especificidad. La sensibilidad es la característica de la prueba que nos indica la proporción de enfermos correctamente diagnosticados, y la especificidad los pacientes sanos correctamente identificados.

Sin embargo hay que tener en cuenta que no todas las pruebas pueden ser muy sensibles y especificas a la vez, y que cuando se aumenta una de estas características disminuye la otra, luego lo ideal es fijar un punto de corte que optimice dicha relación. Habitualmente, una prueba diagnóstica se categoriza como aceptablemente exacta cuando ambas características alcanzan un 80%.

Por otro lado, para analizar estas características, son ampliamente usadas las denominadas curvas ROC, como se puede ver en el gráfico 2, enfrentan sensibilidad frente a especificidad. En estas curvas ROC, se visualiza la validez de una prueba diagnóstica, oscilando entre dos puntos limites, la discriminación perfecta, a la izquierda, en la que la probabilidad de identificar pacientes sanos y enfermos es del 100% y la discriminación nula, a la derecha, en la que la prueba no es capaz de identificar más que al 50% de sanos o enfermos. Además se puede analizar el área bajo la curva, de manera que la prueba con mayor área será la mejor.

stat04

Estudio Estadístico en el Servicio de Análisis Clínicos

Comparación para la obtención de magnitudes bioquímicas y hematológicas de 3 analizadores en muestras de Cuidados Intensivos.

stat05

stat06

Conclusiones

  • La Estadística está presente de forma continua en la sanidad, concretamente en el laboratorio, es una herramienta muy útil al ser este una fuente inagotable de datos.
  • Además, es importante conocerla a nivel básico, ya que facilita la realización de avances en la gestión del laboratorio y de recursos en este, la generación de estudios y posters para congresos, etc.
  • Recalcar la importancia que está tomando la tecnología junto a la estadística, el conocido Big Data, como puede reconocerse en múltiples estudios y debates, puede llegar a ser el futuro de la Sanidad.
Bibliografía
- Curso posgrado de formación permanente “Estadística aplicadas a las Ciencias de la Salud” Universidad Nacional de Educación a Distancia.
 
issn180px  

 

logotransp
Esta página web nace de la necesidad de desarrollar eficientemente nuestro Sistema General de la Calidad. Por tanto, su contenido queda restringido a nuestro Servicio, habiendo habilitado ciertos apartados para la consulta por nuestras partes interesadas, en cumplimiento de la norma ISO 9001:2015 en relación a establecer los procesos para la comunicación con nuestros clientes.