Rong Xu y Quanqiu Wang
La medicina personalizada consiste en administrar el fármaco adecuado al paciente adecuado en la dosis adecuada. La farmacogenómica (PGx), los estudios para identificar variantes genéticas que pueden afectar la respuesta a los fármacos, es importante para la medicina personalizada. Los enfoques computacionales para estudiar las relaciones entre los genes y la respuesta a los fármacos están surgiendo como un área activa de investigación para la medicina personalizada. Actualmente, el estudio sistemático de las relaciones entre fármacos y genes es limitado porque es difícil crear una base de conocimientos sobre relaciones entre fármacos y genes que pueda ser comprendida por máquinas a gran escala y mantenerla actualizada. La literatura científica contiene información valiosa sobre las relaciones entre fármacos y genes, por lo que es la fuente de conocimiento definitiva para los estudios de PGx y para la medicina personalizada. Sin embargo, esta información está en gran parte enterrada en texto libre con una comprensión limitada por parte de las máquinas. Existe la necesidad de desarrollar enfoques automáticos para extraer relaciones estructuradas entre fármacos y genes de la literatura biomédica. En este estudio, presentamos un enfoque semisupervisado para extraer relaciones entre fármacos y genes de MEDLINE. La técnica utiliza un patrón de semilla y aprende iterativamente varias formas en las que la relación puede expresarse en 20 millones de resúmenes de MEDLINE. Nuestro enfoque ha logrado altas precisiones (0,961-1,00) en la extracción de relaciones fármaco-gen de MEDLINE y ha encontrado muchos pares fármaco-gen que no están disponibles en PharmGKB, una base de conocimiento PGx a gran escala curada manualmente.