Actualizado el 02/12/2025

icon Facebook icon Twiiter icon RSS icon EMAIL
  1. Portada
  2. >
  3. Noticias
  4. >
  5. IA para convertir datos no estructurados en estructurados

IA para convertir datos no estructurados en estructurados

Escrito por Guillem Alsina el 18/11/2025 a las 13:44:50
254

No hace falta decir que para trabajar datos de una forma cómoda, lo mejor es que estos sean estructurados, es decir, podamos incluirlos en una base de datos con campos determinados, y/o en una hoja de cálculo (una herramienta que, por cierto, puede tratarse perfectamente como una base de datos, con funcionalidades para ello en las principales aplicaciones como Excel, LibreOffice o Google Sheets), ya que al disfrutar de estructura, los podemos trabajar con herramientas informáticas para analizarlos y obtener respuestas a las preguntas que podamos formular.


El problema es que, en el mundo real, muchas veces nos encontramos con datos no estructurados, y que convertirlos, tanto por su volumen como por su diversidad, es una tarea hercúlea que, si bien agradeceríamos su resultado, no tenemos tiempo ni medios para que nos salga a cuenta hacerla. Y, aquí, es donde entra en juego la inteligencia artificial, cuyo potencial es, precisamente, el lidiar con información no estructurada.


Como ejemplo de sus posibilidades y beneficios, George Bosnjak (chief partnerships & growth officer en Professional Credentials Exchange) publica este artículo en Healthcare Innovation que habla sobre las bondades de la aplicación de la IA al sector médico, el cual cuenta con numerosa información no estructurada, para convertirla a estructurada, aunque sus conclusiones pueden extrapolarse a múltiples sectores.


Bosnjak comienza explicando que factores como el lugar de residencia, el acceso regular a alimentación o transporte, la situación laboral o la estabilidad de la vivienda condicionan la evolución de la salud de las personas. Sin embargo, cuando estos datos llegan a los registros electrónicos (EHR), lo hacen a menudo como texto no estructurado, oculto en cartas de derivación, formularios de admisión o valoraciones sociales guardadas como PDFs independientes.


El efecto no es menor: si una historia clínica (datos estructurados) contiene información sobre inseguridad habitacional pero el profesional no la localiza, dicha información no contribuye a los planes de atención, a las derivaciones a recursos o a los modelos de estratificación del riesgo. El dato necesario para mejorar resultados permanece, en la práctica, invisible.


Gracias a los OCRs y el procesamiento del lenguaje natural mediante IA, es posible revisar con rapidez PDFs, notas clínicas, formularios y otros registros no estructurados, transformándolos en datos estandarizados que se integran en el historial clínico del paciente. Tareas que en el pasado requerían revisiones manuales o equipos dedicados, pasan a resolverse en segundos, mientras que la eliminación de silos de información permite construir una visión más completa del paciente.


Disponer del mismo conjunto de datos enriquecido entre trabajo social, atención primaria, especialidades y gestión de casos, mejora la coordinación y reduce el riesgo de que no se atienda correctamente a un paciente. Además, la automatización de la extracción disminuye el tiempo dedicado a la introducción manual de datos.


Como decía al principio, lo que explica Bosnjak es fácilmente extrapolable a otros sectores que pueden tener numerosa documentación desestructurada, en muchos casos valiosa y que no pueden aprovechar. Solamente necesitan implementar las soluciones adecuadas para empezar a extraer datos útiles de dicho silo.