¿Qué es Ciencia de datos en Salud?
La ciencia de datos está revolucionando el mundo, y el campo de la salud no es una excepción. Pero, ¿Qué es exactamente Ciencia de Datos? Según IBM es un nuevo abordaje para analizar datos y extraer información valiosa y útil para una organización, es el resultado de la intersección de tres campos: matemáticas, ciencias computacionales (inteligencia artificial) y experticia temática, en nuestro caso experticia en salud.
Este abordaje interdisciplinario permite solucionar problemas asistenciales, administrativos en el campo de la salud de manera diferente a la tradicional. A diferencia de la investigación y epidemiología tradicional, donde la estadística y técnicas matemáticas se combinan con la experticia temática para generar hipótesis, la ciencia de datos en salud está llevando este concepto más allá.
Con el advenimiento de la tecnología digital y el aumento exponencial del poder computacional, ahora podemos manejar millones de datos, explorando adecuadamente todo ese volumen de datos con técnicas estadísticas y matemáticas más sofisticadas.
De lo tradicional a lo moderno
Hablar de ciencia de datos no precisamente es enterrar lo clásico, hoy ciencia de datos en salud es usar las técnicas clásicas de la epidemiología pero con «esteroides», es decir se aumenta el tamaño muestral, se analiza en entornos digitales más poderosos, intuitivos y amigables y sobre todo que ese poder de procesamiento está al alcance de cualquier persona, tan solo se necesita acceso a internet y a un navegador web.
| Aspecto | Epidemiología tradicional | Ciencia de datos en salud |
| Metodología | Utiliza métodos observacionales o experimentales. Más lentos y costosos. Limitados a muestras pequeñas. | Emplea algoritmos de machine learning y big data. Análisis más rápidos y eficientes. |
| Tamaño y tipo de datos | Conjuntos de datos más pequeños y seleccionados. | Grandes volúmenes de datos, múltiples fuentes, incluyendo registros electrónicos, imágenes médicas, paraclínicos e incluso datos genómicos. |
| Herramientas y tecnología | Tecnología menos prominente, herramientas específicas para cada estudio. | Utiliza tecnología de vanguardia y herramientas avanzadas de programación y análisis. |
| Enfoque y objetivos | Identificación de causas y factores de riesgo. Centrada en hipótesis específicas. | Enfoque en predicción y personalización, creación de diferentes modelos de clasificación, regresión, etc. |
| Flexibilidad y escalabilidad | Métodos y diseños más rígidos y específicos. | Mayor flexibilidad y escalabilidad. Adaptación de métodos y modelos a diferentes problemas y grandes conjuntos. |
| Ética y privacidad | Sujeta a estrictas regulaciones éticas y de privacidad. Consentimiento informado detallado. | Sujeta a regulaciones, pero con desafíos adicionales en privacidad y consentimiento debido a la cantidad de datos. |
| Interdisciplinariedad | Se enfoca mucho en la práctica e investigación clínica. | Requiere habilidades en matemáticas, estadística, informática y experticia temática en salud. |
Esta comparación no invita a dividir el uso de la epidemiología clásica y ciencia de datos en salud de manera independiente, sino de utilizar esta última con técnicas epidemiológicas para solución de problemas del sector salud que se dan a diario en labores asistenciales y administrativas.
