Spoiler alert!
La fase de PreModelado es la m谩s extensa y la m谩s 芦compleja禄, pero, una vez construida y ejecutada de una manera 贸ptima, el modelado y PosModelado son fases m谩s directas y f谩ciles de ejecutar.
Esta amigable advertencia es un recordatorio de la ventaja de trabajar y pertenecer al campo de la salud y a su vez dise帽ar, crear, supervisar, ejecutar proyectos de ciencia de datos y/o inteligencia artificial en salud. Ventaja, ya que – como se mencion贸 en los Fundamentos de IA en salud – el 茅xito de un modelo de machine learning o deep learning se da en una amalgama que combina tres aspectos: experticia tem谩tica, ciencias computacionales y matem谩ticas.

La fase de PreModelado se caracteriza por usar muchos de los conceptos de los fundamentos, sobre todo de los que tienen que ver con la exploraci贸n, preparaci贸n, an谩lisis y visualizaci贸n de datos, usando en gran medida Python como lenguaje de programaci贸n, t茅cnicas matem谩ticas/estad铆sticas y SQL como llave para interactuar con bases de datos.
Todos quieren implementar IA en sus instituciones, pocos saben en qu茅!
En mi experiencia como cient铆fico de datos en salud, en mis trabajos y en otras empresas como asesor de temas en ciencia de datos en salud, siempre me he topado con el mismo dilema: 驴IA, pero en qu茅?. Y es que al ser un paradigma en auge existe mucha confusi贸n en qu茅 es lo que hace o debe hacer un enfoque de inteligencia artificial en salud.
En este apartado se traza una secuencia de pasos para reconocer el primer escal贸n y as铆 identificar, entender el problema y orientar el o los proyectos en ciencia de datos e IA en salud.
Posterior a la identificaci贸n y entendimiento del problema se debe explorar y entender los datos con los que se cuenta.
Actualmente existen empresas, iniciativas y personas que ofertan servicios de 芦implementaci贸n de modelos de IA a su instituci贸n禄, son iniciativas costosas y explorando cotizaciones que realizan a instituciones, he revisado el detalle del servicio y es una 芦receta de cocina禄 aplicada a los datos que solicitan a la instituci贸n a intervenir (con el peligro que eso conlleva con la normatividad de la privacidad y seguridad de los datos). A cualquier grupo de datos se aplica la misma receta de cocina, sin tomar en cuenta el negocio de la instituci贸n. Me explico, cada instituci贸n, sea una IPS privada (ej. Cl铆nica Reina Sof铆a), sea una IPS p煤blica, sea una EPS, todas tienen intereses distintos y su forma de 芦supervivencia禄 o modelo comercial es diferente. El entendimiento del problema va en l铆nea con el entender dicho modelo, pero seg煤n ello, cada una de dichas instituciones genera o almacena datos diferentes (incluso tambi茅n depende de qu茅 sistema de gesti贸n de informaci贸n utilicen), as铆 que:
鉂撀緾贸mo dichas iniciativas, personas o empresas aplican la misma receta de cocina a instituciones que tienen diferentes ingredientes?
En esta secci贸n discutimos las formas de explorar los datos disponibles seg煤n el problema, la instituci贸n y el modelo de negocio, as铆 perfilar la estrategia para los escalones subsiguientes.
Una vez definido el problema e identificados los datos necesarios pero disponibles de la instituci贸n en cuesti贸n, se debe establecer mecanismos para aprovechar la capacidad instalada de la instituci贸n, de esa manera extraer los datos de las bodegas de informaci贸n (locales, nube, etc.), transformarlos seg煤n nuestras necesidades y objetivos, y cargarlos en un servidor local, en documentos en SharePoint de Microsoft, en la nube, etc., seg煤n la capacidad instalada, el presupuesto y las necesidades de la instituci贸n. Cada uno de dichos pasos cuenta con detalles t茅cnicos y log铆sticos que se abordan en esta secci贸n.

En la imagen se describen los pasos anteriores, luego de la identificaci贸n y entendimiento del problema, hay que abrir la bodega de datos, entender los datos con los que se cuenta y posteriormente clasificarlos y organizarlos (entre ello extraerlos y transformarlos) para posteriormente subirlos al sitio donde se va a enlazar una aplicaci贸n como Power BI, Tableau, incluso Excel para realizar el an谩lisis exploratorio y visualizaci贸n de datos en salud o presentarlos visualmente y contar una historia de manera gr谩fica, entendible y que realmente ayude al personal de la salud a tomar decisiones en sus campos.
