Shashank Reddy Vadyala
La colonoscopia se utiliza para la detección del cáncer colorrectal (CCR). La extracción de detalles de los hallazgos de la colonoscopia a partir de texto libre en registros médicos electrónicos (EHR) se puede utilizar para determinar el riesgo del paciente de CCR y las estrategias de detección colorrectal. Desarrollamos y evaluamos la precisión de un marco de modelo de aprendizaje profundo para extraer información para el sistema de apoyo a la toma de decisiones clínicas para interpretar informes de texto libre relevantes, incluidas las indicaciones, la patología y las notas de los hallazgos. El marco Bio-Bi-LSTM-CRF se desarrolló utilizando la memoria a corto y largo plazo bidireccional (Bi-LSTM) y los campos aleatorios condicionales (CRF) para extraer varias características clínicas de estos informes de texto libre, incluidas las indicaciones para la colonoscopia, los hallazgos durante la colonoscopia y la patología del material resecado. Entrenamos el Bio-Bi-LSTM-CRF y los modelos Bi-LSTM-CRF existentes en el 80% de 4000 notas anotadas manualmente de 3867 pacientes. Estas notas clínicas eran de un grupo de pacientes mayores de 40 años inscritos en cuatro centros médicos de Asuntos de Veteranos. Un total del 10% de las notas anotadas restantes se utilizaron para entrenar hiperparámetros y el 10% restante se utilizó para evaluar la precisión de nuestro modelo Bio-Bi-LSTM-CRF y compararlo con Bi-LSTMCRF. Nuestros experimentos muestran que las representaciones del codificador bidireccional mediante la integración del vector de función de diccionario de Bio-Bi-LSTM-CRF y el enfoque de incrustación de secuencias de caracteres de estrategias es una forma eficaz de identificar características de colonoscopia a partir de notas clínicas extraídas de EHR. El modelo Bio-Bi-LSTM-CRF crea nuevas oportunidades para identificar pacientes en riesgo de cáncer de colon y estudiar sus resultados de salud.