27 marzo 2020

Tecnologías del Lenguaje Natural, en el ámbito de la biomedicina más allá del inglés

"Estaba una señora sentada sola en la mesa de un restaurante, y tras leer la carta decidió pedir una apetitosa sopa en la que se había fijado.  

El camarero, muy amable le sirvió el plato a la mujer y siguió haciendo su trabajo. Cuando éste volvió a pasar cerca de la señora ésta le hizo un gesto y rápidamente el camarero fue hacia la mesa.

– ¿Qué desea, señora?
– Quiero que pruebe la sopa.

El camarero, sorprendido, reaccionó rápidamente con amabilidad, preguntando a la señora si la sopa no estaba rica o no le gustaba.

– No es eso, quiero que pruebe la sopa.

Tras pensarlo un poco más, en cuestión de segundos el camarero imaginó que posiblemente el problema era que la sopa estaría algo fría y no dudó en decirlo a la mujer, en parte disculpándose y en parte preguntando.

– Quizás es que esté fría señora. No se preocupe, que le cambio la sopa sin ningún problema…
– La sopa no está fría. ¿Podría probarla, por favor?

El camarero, desconcertado, dejó atrás la amabilidad y se concentró en resolver la situación. No era de recibo probar la comida de los clientes, pero la mujer insistía y a él ya no se le ocurrían más opciones. ¿Qué le pasaba a la sopa? Lanzó su último cartucho:

– Señora, dígame qué ocurre. Si la sopa no está mala y no está fría, dígame qué pasa y si es necesario, le cambio el plato.
– Por favor, discúlpeme pero he de insistir en que si quiere saber qué le pasa a la sopa, sólo tiene que probarla.

Finalmente, ante la petición tan rotunda de la señora, el camarero accedió a probar la sopa. Se sentó por un momento junto a ella en la mesa y alcanzó el plato el plato de sopa. Al ir a coger una cuchara, echó la vista a un lado y otro de la mesa, pero… no había cucharas. Antes de que pudiera reaccionar, la mujer sentenció:

– ¿Lo ve? Falta la cuchara. Eso es lo que le pasa a la sopa, que no me la puedo comer."

Este relato de Jorge Bucay, nos sirve como preámbulo para profundizar en la dificultad de la comunicación entre las personas y finaliza con la investigación en el ámbito del Codvid-19.

El lenguaje natural es “no controlado”  y por lo tanto supone un gran el reto de innovación llevar este conocimiento a los procesos de computación. El objetivo es encontrar mecanismos computacionales que permitan reconocer, comprender y generar el lenguaje natural, permitiendo tratarlo automáticamente para analizarlo, interpretarlo y generarlo.

Hoy os traemos una entrevista a la Dra. Arantza del Pozo Echezarreta, Directora de Tecnologías del Habla y del Lenguaje Natural en el centro tecnológico Vicomtech.

Para ir aproximando los conceptos, ¿ Como se encuentra el estado del arte en el Procesamiento del Lenguaje Natural a nivel internacional respecto al nacional, hay mucha diferencia en las capacidades sobre el Inglés, respecto a Castellano ? 

 Podemos decir que es comparable. Debido a su naturaleza internacional, el inglés se emplea con mayor frecuencia en el ámbito de la investigación en Procesamiento del Lenguaje Natural, lo que hace que existan más recursos lingüísticos públicos disponibles para ese idioma. Pero el español es el segundo idioma en número de hablantes nativos, detrás del chino mandarín, lo que ha impulsado el desarrollo tanto de recursos como de herramientas de Procesamiento de Lenguaje Natural para español, debido a su mercado potencial.

Si nos adentramos en el ámbito de la Analítica de Textos Multilingües,  ¿ Como de maduras se encuentran las tecnologías del lenguaje (TL) en función de que hablemos de Inglés, Castellano o lenguas autonómicas como el Euskera ?

  Las técnicas que se emplean para analizar textos multilingües se basan hoy en día en el aprendizaje automático y, más recientemente, en el aprendizaje profundo o deep learning. En este contexto, las arquitecturas utilizadas son independientes del idioma, pero los datos con los que se entrenan sí que dependen del idioma que se quiera analizar. Por eso, los datos o recursos lingüísticos tienen un papel clave en el desarrollo de aplicaciones de Analítica de Textos Multilingües en la actualidad. Debido a su número de hablantes, la cantidad de recursos disponibles para inglés o español es más elevada que para el euskera, que es considerado idioma de pocos recursos. Aún así, la comunidad científica de Procesamiento de Lenguaje Natural vasca está realizando un esfuerzo importante para compilar los datos necesarios para que el euskera pueda estar al nivel de los otros idiomas. Y se están obteniendo muy buenos resultados en varios ámbitos de aplicación, como la traducción(1) o la transcripción(2) automáticas.

Cuando nos adentramos en un ámbito de aplicación concreto como es el Biomédico, ¿ Que importancia tiene disponer de sistemas adaptados y especializados en el campo en el que nos encontremos? ¿ Es necesario disponer de un  sistema de terminología, en la especialidad médica de la que se trate, como puede ser los dominios de Oncología, Radioterapia, Infección Nosocomial, Alzheimer,etc...?

El concepto de “dominio” es muy importante en el ámbito del Procesamiento de Lenguaje Natural. Y es que la terminología y las estructuras lingüísticas empleadas dependen mucho del dominio de aplicación: artículos periodísticos, textos legales, notas clínicas, informes de mantenimiento, etc. contienen vocabularios y tipos de frases muy diferentes. En general, los humanos somos capaces de entender con facilidad textos de dominios más generalistas como las noticias, pero necesitamos conocimiento específico del dominio para entender textos legales o informes clínicos. Lo mismo les ocurre a las máquinas. Para poder procesar textos Biomédicos con precisión, es clave disponer de terminología y datos del dominio para poder adaptar la tecnología al ámbito de aplicación. El dominio Biomédico es además más complejo que otros dominios, ya que cada especialidad médica cuenta con su terminología y vocabulario particulares. Cuanto más se adapte la tecnología al dominio específico de aplicación, mejores resultados se obtendrán.
 
Dado el alcance que tiene el inglés en el campo Biomédico ¿ Hoy en día se pueden tratar textos médicos en castellano con una alto grado de fiabilidad ? 

  A diferencia del ámbito más generalista en el que la fiabilidad del procesamiento del inglés y el español puede considerarse comparable, en el campo Biomédico el inglés le lleva la delantera no sólo (3) o el CIE(4). El Metatesauro UMLS(5) (del inglés, Unified Medical Language System) aglutina las distintas terminologías médicas estándar disponibles y consta de 2.8 millones de términos en inglés pero solo el 12% se encuentran para español, que es el segundo idioma con mayor representación. El resto de idiomas cuenta sólo con hasta un 3% de representación, en el mejor de los casos. Por este motivo, hoy en día se requiere de un mayor esfuerzo de desarrollo y expansión terminológica a la hora de implementar tecnología de procesamiento de textos médicos en español. Sin embargo, cuando se llevan a cabo dichas tareas para los dominios de aplicación en cuestión, la fiabilidad del procesamiento de textos clínicos en español es elevada..
al español, sino al resto de idiomas en general. La comunidad médica internacional ha realizado un esfuerzo importante en la estandarización de la terminología médica, definiendo estándares que se pueden emplear para intercambiar datos clínicos con propósitos de investigación médica. Algunos de los estándares más conocidos son el SNOMED-CT

El lenguaje utilizado en la práctica clínica es complejo, en algunos casos ese un lenguaje  ambiguo,  muy dependiente del contexto,  expresivo, se usan abreviaturas sin su forma extendida, ¿ Se pueden aplicar la tecnologías del lenguaje natural (TL) a esta casuística concreta, con efectividad ?

  Las herramientas de procesamiento de textos clínicos han de tener en cuenta las características particulares del dominio: alto porcentaje de errores orto-tipográficos, número elevado de abreviaturas dependientes del contexto y especialidad de aplicación, presencia de atributos ligados a la negación o (6) o en la detección de negación en informes clínicos(7) a través de competiciones internacionales. Por lo tanto, podemos decir que se está trabajando en del desarrollo de tecnologías del lenguaje natural para procesar la complejidad de los textos clínicos con efectividad.
la especulación y, tal y como hemos mencionado antes, la terminología específica de cada especialidad clínica en cuestión. Para lidiar con estos retos, se han de implementar módulos tecnológicos capaces de gestionarlos. La comunidad científica está avanzando rápida y considerablemente en el desarrollo de técnicas de detección y desambiguación de abreviaturas

Si damos un paso más allá de los ensayos clínicos y alineamos los desarrollos tecnológicos, en el ámbito de la práctica clínica y con el Real World Data (RWD), ¿ Cómo nos ayudas la tecnologías del lenguaje? ¿ Que casos de uso son de aplicación en el contexto de RWD ?

  El Real World Data es información capturada como subproducto de la atención diaria al paciente, que complementa a los ensayos clínicos randomizados para el desarrollo de fármacos. Una fuente
importante de información RWD son los registros de salud electrónicos de los pacientes, los foros o las redes sociales, en los que el 80% de la información clínica se encuentra en forma de texto libre no estructurado y difícil de explotar electrónicamente. Las tecnologías del lenguaje nos permiten estructurar dicha información, p.ej. identificando automáticamente síntomas, patologías, fármacos y/o efectos adversos, convirtiendo los textos clínicos en inteligencia procesable para tomar decisiones. Algunos casos de uso de aplicación en el contexto de RWD son: la detección de desviaciones en protocolos de ensayos clínicos, el análisis de los sentimientos de los pacientes o la identificación de la satisfacción y resultados de los tratamientos, entre otros.

Para finalizar, nos gustaría conocer ¿ Como nos encontramos respecto a la Medicina predictiva ? ¿Disponemos de la tecnología necesaria para su implementaciones basada en TL ? ¿ Cual es tu previsión de los campos Biomédicos que más van a evolucionar en el corto plazo ?

Se están dando pasos hacia la incorporación de las Tecnologías del Lenguaje en las aplicaciones de Medicina Predictiva. A pesar de que todavía estamos lejos de poder analizar cualquier tipo de texto clínico en español de forma precisa y fiable, el estado del arte permite obtener buenos resultados en nichos específicos de aplicación. Ya estamos desarrollando aplicaciones de Medicina Predictiva basadas en TL relacionadas con la investigación clínica en especialidades como la anatomía patológica o la salud mental y, en los próximos meses, esperamos poder avanzar significativamente también en la investigación y el análisis predictivo del Covid-19.

Agradecer a la Dra. Arantza del Pozo Echezarreta, Directora de Tecnologías del Habla y del Lenguaje Natural en el centro tecnológico Vicomtech. por compartir su experiencia.

Fuentes:






12 marzo 2020

Seguimiento de casos por el coronavirus, COVID-19

Hoy recogemos diferentes web, que permiten hacer un seguimiento al número de casos de coronavirus COVID-19.












- Empezamos con la del Ministerio de Sanidad. Con el resumen de la situación con los casos confirmados en España:





- La Información sobre Euskadi del Gobierno Vasco:






- Referencia internacional, Coronavirus COVID-19 Global Cases by the Center for Systems Science and Engineering (CSSE) at Johns Hopkins University (JHU) :





- Aquí se puede ver en tiempo real el seguimiento de la evolución del patógeno "Genomic epidemiology of novel coronavirus (hCoV-19)" :






- Aquí la web The base lab, que muestra gráficamente la información a nivel mundial:






- La Organización Mundial de la Salud WHO :






- Dos estudiantes de la  Carnegie Mellon University :



17 febrero 2020

Motxila 21 prepara su segundo disco

Tras su primer disco «No somos distintos», el grupo Motxila 21  nacido hace 15 años, se encuentran trabajando en su segundo disco:

"Motxila21 es un grupo de música formado por 12 chavales con Síndrome de Down y 9 voluntarios, surgido por el amor a la música y el esfuerzo de la superación.

Son muchas las ocasiones en las que la gente suele preguntar por el significado de Motxila21, es la mochila la que le pesa al cromosoma 21, esa que hace que las personas con Síndrome de Down sean lo que son, personas  que necesitan expresarse, divertirse, comunicarse en definitiva de hacer lo que todos deseamos y amamos. En escena lo que se ve es a un grupo de personas capaces de divertirse, comunicarse y de emocionarse a través de la música, y  ésta a su vez les aporta ilusión y sueños. Con la mochila son capaces de realizar un viaje musical inolvidable. Ese es el viaje al que invitamos a todos los que nos quieran escuchar. "

Tras
Os dejamos la última colaboración de Motxila 21, con "El Drogas" en su nueva canción "Al salir la luz":



11 febrero 2020

Día Internacional de la mujer y la niña en la ciencia

En Bilbomática estamos trabajando para romper con los prejuicios de género vinculados a la tecnología, por eso desde hace un año colaboramos con el proyecto #INSPIRA STEAM:

Inspira STEAM es un proyecto pionero para el fomento de la vocación científico-tecnológica entre las niñas, basado en acciones de sensibilización y orientación, que imparten mujeres profesionales del mundo de la investigación, la ciencia y la tecnología. Se trata de la primera vez que se utiliza la técnica del mentoring grupal en un proyecto de fomento de las STEAM (Science, Technology, Engineering, Arts and Maths) entre estudiantes de primaria.
El corazón de nuestro proyecto son las mentoras, que de manera voluntaria, acercan su día a día a niñas y niños a través de 6 sesiones de trabajo en horario lectivo. Todas ellas son científicas y tecnólogas que desarrollan su actividad profesional en diferentes ámbitos: académico, empresarial, investigación, gestión, etc.
Durante las sesiones de trabajo se abordan temas como los estereotipos que nos rodean, el trabajo o mujeres y ciencia a lo largo de la Historia. Con estos encuentros entre mentora y niñas se quiere ayudar a disipar dudas y objeciones sobre las profesiones en ciencia y tecnología, a clarificar sus motivaciones y a afianzar su autoestima para iniciar dicho camino profesional, si así lo desean.
Inspira STEAM nace de la necesidad de promocionar vocaciones científicas y tecnológicas entre el alumnado y de la urgencia de hacerlo entre las niñas. El número de estudiantes que optan por una formación en tecnología decrece cada año. Y si nos referimos al colectivo femenino, los datos se agudizan aún más. A pesar de que el 54,3% del total de estudiantes del sistema universitario español son mujeres, su presencia en las titulaciones técnicas como Ingeniería y Arquitectura decae al 26,4%.
Inspira STEAM es un proyecto promovido por la Universidad de Deusto, que cuenta con la colaboración de Innobasque en Euskadi, Edenway y la Universitat Rovira i Virgili en Cataluña, CIONET en Madrid, la UCA y Universidad de Jaén en Andalucía, la Universidad de Vigo y la Universidade da Coruña en Galicia, la Universidad de Oviedo en Asturias y la financiación de las tres diputaciones forales: BizkaiaGipuzkoa y Álava además de BBKRocheBarcelona ActivaSilkHP Foundation y Ayuntamiento de San Sebastián.
 "Comprometámonos a acabar con el desequilibrio de género en la ciencia , y a promover el acceso de las mujeres y las niñas a la educación, la formación y el empleo en el ámbito de la ciencia."

19 diciembre 2019

05 diciembre 2019

Causa solidaria contra el cáncer infantil EiTB Maratoia

Hoy os dejamos la información de la causa solidaria EiTB Maratoia, que este año se hace eco del cáncer infantil.

"La presentación de la fase final de la iniciativa se ha realizado este lunes en la sede de EiTB de Bilbao con la participación de la consejera de Salud del Gobierno Vasco Nekane Murga, la directora general de EiTB Maite Iturbe, la jefa del servicio de Pediatría del Hospital Universitario de Cruces Itziar Astigarraga y una representación de las distintas asociaciones de afectados por el cáncer infantil y de las entidades que han colaborado con la campaña..."

"..La consejera de Salud Nekane Murga ha subrayado el firme y rotundo compromiso del Departamento de Salud y Osakidetza en la lucha contra el cáncer infantil y juvenil, con el objetivo de aumentar la curación y mejorar el pronóstico, ofreciendo una atención integral y multidisciplinar, y apostando por la investigación. 

En este sentido, la consejera ha destacado que el cáncer infantil y juvenil es un área de investigación importante en Osakidetza, que cuenta en estos momentos con 48 proyectos y estudios clínicos en activo con una financiación que suma los 1,5 millones de euros..." 

Dentro de esta iniciativa, han creado un espacio donde "te invitan a formar parte de algo grande: crear la mejor versión que se haya hecho nunca de Lau Teilatu para luchar contra el cáncer infantil. Así que si cantas bien, cantas mal, tocas algún instrumento o no… " 

La canción Lau teilatu (Oskorri) como describen en El Correo en una entrevista:

"... 'Lau teilatu' les salió tan preciosa que les dio 'palo' meter la letra en el cuadernillo de aquel primer álbum, ya se sabe, por la pose rockera: «Es que era tan bonita... La compuse con la guitarra en mi casa de Mutriku y la tocábamos con Indar Trabes (grupo de verbenas que fue la semilla de Itoiz) para testarla, pero no tenía mucho éxito porque no era para bailar»."

Versión del grupo Motxila 21 de 'Lau Teilatu':

"Quién se lo iba a decir. Aquella balada es hoy una especie de himno alternativo para los vascos; en el canal de youtube del profesor de euskera Gabi de la Maza, que pone la letra en vídeos de canciones vascas, un karaoke, 'Lau teilatu' es con mucho la más vista, 2,5 millones de reproducciones. «Es lo que es, una canción de amor adolescente, hiperrealista, muy transparente», reconoce Pérez. Y se convirtió en la canción en la que cualquier joven vasco de la época podía reconocerse: «Felix felix bihar berriz izango gara, txanpain apur batekin, diru gabe baina, izarrak gurekin daude, piano baten soinuaz» (Mañana volveremos a estar felices felices con un poco de champán, sin dinero, pero las estrellas están con nosotros en el sonido de un piano). Y por eso de estar felices en las fiestas de cualquier pueblo ('edozein herriko jaixetan')."

Por último para cerrar esta entrada os dejamos otro video, en esta ocasión de los músicos Pirata Piratobich & Litus, del programa "Late Motiv" de Andreu Buenafuente, que se han sumado a #EiTBMaratoia con esta íntima versión de "Lau Teilatu":




03 diciembre 2019

Permitiendo la toma de decisiones informadas en el cáncer de mama a través de las tecnologías de la información

Tal y como recogemos en el último Boletín del proyecto DESIREE "Sistema de apoyo a la toma de decisiones y gestión de la información para el cáncer de mama", cuarenta y dos meses después de la reunión de lanzamiento del proyecto en San Sebastián (febrero de 2016), nos enorgullece anunciar que el proyecto financiado por la UE Horizonte 2020, ha sido completado con éxito en julio de 2019. La última Reunión de Revisión, realizada el 18 de septiembre en Luxemburgo, confirmó con su evaluación final la finalización del trabajo, reconociendo un impacto clínico significativo de herramientas de gran valor para el tratamiento del cáncer de mama.

Destacando como cierre del proyecto, el último Workshop 360º  "Relevant Outcomes on Big Data and Decision Support Systems for Cancer Management", realizado en las instalaciones de nuestro socio del proyecto Onkologikoa (centro médico especializado en prevención, diagnóstico, investigación y tratamiento del cáncer a nivel internacional). Donde se presentaron los avances en los sistemas de apoyo a la toma de decisiones, el análisis de imágenes, modelización computacional, así como las perspectivas clínicas sobre el uso de dichos sistemas y diferentes iniciativas relacionadas a nivel local e internacional, incluido el "Big Data" en el ámbito de oncología.



Por último os dejamos las publicaciones científicas que avalan los trabajos realizados por los participantes durante todo el proyecto.

El consorcio DESIREE, coordinado por Vicomtech, ha estado formado por 11 participantes de 6 países que han contado con toda la experiencia y conocimientos para alcanzar los ambiciosos objetivos que ha perseguido el proyecto:
- Vicomtech - Coordinator http://www.vicomtech.org/en Spain
- Arivis AG http://www.arivis.com Germany
- Assistance Publique – Hôpitaux de Paris http://www.aphp.fr/ France
- Bilbomatica http://www.bilbomatica.es Spain
- ERESA http://www.eresa.com Spain
- Fundación Onkologikoa http://www.onkologikoa.org Spain
- INSERM-LIMICS http://www.limics.fr France
Medical Innovation and Technology http://www.medicalinnovation.gr Greece
Sistemas Genómicos http://www.sistemasgenomicos.com Spain
Houston Methodist Research Institute http://www.houstonmethodist.org/ USA
Ulster University http://www.ulster.ac.uk UK


Este proyecto ha recibido fondos de la Unión Europea en el marco del programa de investigación e innovación Horizon 2020 con el número de acuerdo de subvención 690238
 Los autores quieren agradecer el conocimiento y las contribuciones de los miembros del consorcio.



This project has received funding from the European Union´s Horizon 2020 research and innovation programmme under grant agreement No 690238.
The authors wish to thank all consortium members the knowledge and contributions.

Infoday sobre tecnologías del lenguaje en sanidad y biomedicina

Hoy recogemos la jornada dirigida a difundir las iniciativas puestas en marcha por parte del Plan TL, así como las colaboraciones y resultados generados en el sector de la sanidad.
Esta jornada, ha sido organizada por Barcelona Supercomputing Center - Centro Nacional de Supercomputación (BSC-CNS),

Entre los temas a tratar, se pueden destacar los recursos e infraestructuras lingüísticas generadas, las aplicaciones y usos de estas tecnologías para la salud, así como la importancia de entornos de evaluación y exploración de nuevas oportunidades que se abren con los avances en la aplicación de las tecnologías del lenguaje en la sanidad y en la biomedicina.

Os dejamos la intervención de Arantza del Pozo (Vicomtech) en la mesa redonda: Industria de tecnologías del lenguaje e informática de la salud: retos, avances y necesidades:

Moderador: Pablo Serrano - Hospital 12 de Octubre, participantes:


Aprovechamos para dejaros información sobre "BATUA", que es un servicio de traducción automática basado en Inteligencia Artificial y Redes Neuronales para Euskera y Castellano, cuyo promotor es Vicomtech y patrocinado por Euskaltel y Mondragon lingua.




22 noviembre 2019

La inteligencia artificial y las tecnologías del lenguaje: oportunidades y retos


Durante el congreso Basque Industry 4.0 se han llevado a cabo una serie de conferencias y seminarios, donde destacamos "La inteligencia artificial y las tecnologías del lenguaje: oportunidades y retos" con el objetivo de mostrar a las empresas las oportunidades que ofrecen la inteligencia artificial y las tecnologías del lenguaje y conocer las necesidades y los retos de futuro que tendrán que afrontar las empresas en este ámbito.

Tuvimos la oportunidad de conocer de primera mano, los activos y servicios disponibles por parte de HiTZ - Centro Vasco de Tecnología de la Lengua. UPV/EHU , Vicomtech y Elhuyar , en el ámbito de la inteligencia artificial y las tecnologías del lenguaje, os dejamos unos fragmentos de las intervenciones (Euskera):




El taller finalizó con la identificación de las necesidades que tendrá la industria vasca dentro de cinco/diez años, en el campo de la inteligencia artificial y las tecnologías del lenguaje.


21 noviembre 2019

Industria 4.0 desarrollo al servicio de la sociedad e impacto social positivo - Inteligencia Artificial - * Actualizado *

En el congreso Basque Industry 4.0

celebrado en el BEC durante los días 20 y 21 de Noviembre

, se han dado cita 3.700 empresas industriales, centros tecnológicos y personas emprendedoras con objeto de exponer la Industria 4.0 al servicio de la sociedad, la ciberseguridad, las startups y stands de empresas, Basque Research & Technology Alliance (BRTA)  y  los Activos 4.0.

Bilbomática ha estado presente en este congreso, y aquí os dejamos un apunte en el ámbito de las ponencias: 

Destacamos la excelente presentación de apertura, que realizó Nuria Oliver, ingeniera en telecomunicaciones y doctora por el Media Lab del Instituto Tecnológico de Massachusetts MIT, bajo el título “Hacia una Industria 4.0 para el bien común”  y la posterior entrevista realizada por Eva Caballero de Radio Euskadi (La mecánica del caracol), la cual os presentamos a continuación:



Rescatamos uno de los aspectos de la exposición de Nuria Oliver, que presentó en el discurso a la Real academia de Ingeniería "INTELIGENCIA ARTIFICIAL VERSUS INTELIGENCIA HUMANA"

"… El éxito reciente de los sistemas de Inteligencia Artificial –como he ilustrado anteriormente– quizás esté desviando la atención respecto a problemas fundacionales de la Inteligencia Artificial actual que todavía están por resolver. Entre otros: (a) la necesidad de incorporar semántica y razonamiento en los sistemas de procesamiento del lenguaje natural; (b) la necesidad de desarrollar representaciones de la incertidumbre que sean tratables computacionalmente; (c) la importancia de desarrollar sistemas que puedan formular, adaptarse y perseguir objetivos a largo plazo; (d) la importancia de representar e
inferir la causalidad; (e) la necesidad de incorporar la información de contexto en los modelos; (f) la capacidad para aprender constante, incremental y asociativamente; y (g) la importancia de que los modelos estén dotados de robustez, de manera que no fallen estrepitosamente cuando se cambian ciertas características en los datos de entrada, como sucede hoy en día.…”

Por ultimo os dejamos información del recien creado Basque Research & Technology Alliance (BRTA) 

 "BRTA nace para atender a los retos industriales de Euskadi y competir con las grandes corporaciones líderes internacionales en investigación y desarrollo de tecnología. Esta gran alianza constituirá la punta de lanza de la investigación vasca en Europa y el resto del mundo.

Basque Research and Technology Alliance se ha creado a través de un convenio de colaboración entre 16 centros tecnológicos y centros de investigación cooperativa pertenecientes a la Red Vasca de Ciencia, Tecnología e Innovación, el Gobierno Vasco, las Diputaciones Forales de Álava, Bizkaia y Gipuzkoa y el Grupo SPRI."

12 noviembre 2019

La seguridad de los desarrollos en tecnologías de la información

Partiendo del marco de la adecuación a lo previsto en el Esquema Nacional de Seguridad , establecido en la ley 11/2007, de 22 de junio, de acceso electrónico de los ciudadanos a los servicios públicos y la necesidad de las empresas de tecnologías de la información de buscar la mejora continua en sus procesos de desarrollo software, para satisfacer las necesidades de la Administración y por extensión de los clientes privados.

Hoy recogemos algunos aspectos en los que Bilbomática se encuentra trabajando para desarrollar y mantener aplicaciones confiables.

Una buena referencia es la OWASP™ Foundation the free and open software security community  y en concreto el proyecto OWASP Application Security Verification Standard (ASVS) que proporciona una base para probar los controles técnicos de seguridad de las aplicaciones y también proporciona a los desarrolladores una lista de requisitos para el desarrollo seguro. Permitiendo normalizar el rango de cobertura y el nivel de rigor a la hora de realizar la verificación de seguridad de aplicaciones  utilizando un estándar abierto. El estándar proporciona una base de seguridad técnica de las aplicaciones, en el que se confíe para protegerse contra vulnerabilidades como el Cross-Site Scripting (XSS) y la inyección SQL. Este estándar puede utilizarse para establecer un nivel de confianza en la seguridad de las aplicaciones.

Principalmente, proporcionando a los desarrolladores un criterio con el que evaluar el grado de confianza que se puede depositar en los desarrollos realizados, orientando cómo incluir controles de seguridad para satisfacer los requisitos de seguridad de las aplicaciones y especificando los requisitos de verificación de la seguridad.

El Application Security Verification Standard (ASVS) se encuentra en la actualidad en su versión 4.0. y recoge tres niveles de verificación de seguridad de las aplicaciones:

- Nivel 1 es para niveles de seguridad bajos y es completamente comprobable de penetración.

- Nivel 2 es para aplicaciones que contienen datos confidenciales, lo que requiere protección y es el nivel recomendado para la mayoría de las aplicaciones.

- Nivel 3 es para las aplicaciones más críticas - aplicaciones que realizan transacciones de alto valor, contienen datos médicos sensibles, o cualquier aplicación que requiera el más alto nivel de confianza.

Cada nivel de ASVS contiene una lista de requisitos de seguridad y cada uno de estos requisitos también dispone de características y capacidades específicas de seguridad que deberemos incorporar al software.


La arquitectura de seguridad en ASVS cubre los aspectos más importantes de este ámbito, como son: disponibilidad, confidencialidad, integridad, no repudio y privacidad.

Cada uno de estos principios de seguridad lo incorporaremos en todos los desarrollos de forma natural al proceso de construcción de software y garantizaremos que todos los controles de seguridad estén presentes y sean funcionales. Teniendo en cuenta los aspectos detallados en los requisitos de verificación:

Como ejemplo en V13 Requisitos de verificación de API y servicios web, el objetivo es controlar y asegurar de que una aplicación que utiliza APIs en la capa de servicio  (normalmente utilizando JSON, XML o GraphQL) lo hace de forma segura en los aspectos de:

- Autenticación, gestión de sesiones y autorización de todos los servicios web.
- En la validación de las entradas de todos los parámetros que se envíen.
- Controles de seguridad eficaces para todos los tipos de API.

Estableciendo cuatro subniveles de clasificación de las verificaciones a realizar:

V13.1 Requisitos genéricos de verificación de seguridad del servicio web
V13.2 Requisitos de Verificación del Servicio Web RESTful
V13.3 Requisitos de Verificación de Servicios Web SOAP
V13.4 GraphQL y otros requisitos de seguridad de la capa de datos de servicios web

Por ultimo, os dejamos un interesante articulo "Hacking JSON Web Tokens (JWTs). And how attackers forge tokens and log in as someone else" publicado en Medium.com por Vickie Li, que permite entrar de lleno en la complejidad de la seguridad y las buenas prácticas en las implementaciones software.





Algunos links de referencia:

Application Security Verification Standard 4.0

https://www.owasp.org/index.php/Category:Java

https://www.owasp.org/index.php/Category:OWASP_.NET_Project

https://www.owasp.org/index.php/Category:OWASP_Download





01 octubre 2019

Tecnologías del lenguaje aplicadas al campo biomédico

En el marco de la XXXV Conferencia Internacional de la SEPLN, hemos asistido a la jornada organizada por la Secretaría de Estado para el Avance Digital , dirigida a difundir las iniciativas puestas en marcha en el Plan de Impulso de las Tecnologías del Lenguaje en distintos sectores de actividad, mostrar resultados de estudios que se han llevado a cabo recientemente y resaltar la importancia de las campañas de procesamiento del lenguaje natural en el campo de la sanidad y la biomedicina.

Durante la jornada, pudimos ver los aspectos destacados del Plan TL ( Plan de impulso de las tecnologías del lenguaje): Seguimiento del Plan TL , Infraestructuras Lingüísticas y Anotación, así como los proyectos europeos de traducción automática.

También pudimos conocer los estudios que en el ámbito del Plan TL, se están realizando: Estrategias formativa, Corpus Viewer, sistemas conversacionales, viabilidad de una versión en español del sistema UMLS, datos reutilizables como recursos lingüísticos y las Campañas de evaluación sobre infraestructuras lingüísticas.

La segunda parte de la jornada verso sobre las campañas de evaluación en sanidad, como  motor de generación de recursos
lingüísticos en biomedicina y sanidad y la mesa redonda  sobre la experiencias, necesidades, impacto y visión de participantes en este ámbito. que modero Montserrat Marimon,de la Oficina Técnica del Plan TL – BSC y  con la participación de Pilar López Úbeda, del Grupo SINAI, de la Universidad de Jaén, Naiara Pérez, de Vicomtech , Fadi Hassan, de la Universitat Rovira i Virgili Jordi Porta, Real Academia Española - RAE


El Plan de Impulso de las Tecnologías del Lenguaje (Plan TL) tiene como objetivo fomentar el desarrollo del procesamiento del lenguaje natural, la traducción automática y los sistemas conversacionales en lengua española y lenguas cooficiales.