• No results found

Traducción automática

Desde los años cincuenta del siglo xx, los lingüistas computacionales intentan establecer, con modesto éxito, las reglas para la traducción automática. Pero no fue hasta los años noventa cuando aconteció un notorio avance: los in- vestigadores desarrollaron un modelo basado en la estadística a partir de una gran cantidad de frases en inglés y francés proceden- tes del Parlamento Cana- diense, en el que se usan ambos idiomas. Hoy en día es posible reproducir el contenido central de un texto, incluso cuando es- tos sistemas no disponen, desde hace tiempo, del se- guimiento de traductores humanos. Con todo, solo tiene aplicación práctica cuando ambos colaboran: la máquina propone, el

humano escoge, y la má- quina aprende de ello.

Lectura automática

La agrupación de numero- sos textos resulta sobre todo útil en el ámbito científico y, en especial, en medicina. Permite revisar, resumir y valorar conti- nuamente las novedades en la creciente producción de artículos. Sistemas ac- tuales como DeepDive, de la Universidad Stanford, comparan los nuevos tex- tos con los estudios publi- cados y almacenados en una base de conocimiento.

Sistemas de asistencia lingüística (bot con- versacional)

Siri, de Apple, además de Cortana, de Microsoft, y Google Now, son algunos de ellos. Estos programas reconocen el lenguaje, in-

tentan averiguar los de- seos del usuario, formulan preguntas, buscan los da- tos necesarios e informan al interesado. También funcionan como inteligen- cia artificial en robots asistentes o como tutores en forma de avatar. En contextos bien definidos prestan un buen rendi- miento, pero no ante un tema de conversación cualquiera.

Análisis del

sentimiento y minería de opinión

Su objetivo consiste en ex- traer los sentimientos, las opiniones y las actitudes de los comentarios que aparecen en las redes so- ciales u otros portales con el fin de deducir de ellos las debilidades de un pro- ducto, las oportunidades de éxito de un político o la

futura cotización bursátil, entre otras informaciones. La mayoría de los sistemas solo estiman el grado po- sitivo o negativo de la va- loración. Sin embargo, ya existen los primeros in- tentos de registrar las emociones básicas (ale- gría, tristeza, miedo, ira, asco y sorpresa) de los tex- tos. Ante formas de expre- sión complejas, como la ironía, la investigación aún está en pañales.

Minería de datos en redes sociales

Permite extraer de los tex- tos en Internet rasgos de quien escribe: edad y sexo, personalidad y enferme- dades. También se utiliza para descubrir las valora- ciones de productos fal- sas, así como los perfiles fraudulentos en las pági- nas web de citas.

M E N T E Y C E R E B R O 71 N .O 8 6 - 2 0 1 7

vestigan sus algoritmos con datos y examinan si cumplen su cometido. En un experimento publicado en 2016, informáticos turcos analizaron los métodos estadísticos que permitían extraer palabras clave de los textos cien­ tíficos y categorizar esos documentos. El ganador (una combinación de los algoritmos denominados Ramdom, Forest y Bagging) alcanzó una tasa de aciertos de casi el 94 por ciento.

En 2015, psicólogos de la Universidad Carnegie Mellon fueron más allá: investigaron en qué medida estos procedimientos matemáticos coinciden con el proceso de aprendizaje natural. A partir de un artículo de revisión sobre los principios estadísticos en el apren­ dizaje temprano del lenguaje constataron, por ejemplo, que los lactantes determinan la separación de las pala­ bras mediante la probabilidad con la que aparecen juntas las secuencias de fonemas. De esta manera, rela­ cionan las sílabas que se suceden a menudo con una misma palabra. También confirmaron que los bebés se orientan por distribuciones de frecuencias para dife­ renciar los fonemas. Ante dos variantes de pronunciación frecuentes deducen, de forma inconsciente, que se trata de dos fonemas distintos. Cuando la pronunciación se distribuye en un pico, aprenden que es un mismo y único fonema.

Hasta los años setenta del siglo pasado se solían insertar directamente las normas lingüísticas (como la categorización de las palabras en sustantivos, verbos y adjetivos) para enseñar al ordenador a entender el lenguaje humano. Sin embargo, este método resultaba complicado, entre otras razones, porque una misma palabra puede tener diferentes significados («ser» exis­ te como verbo y como sustantivo). Pero tales ambigüe­ dades pueden resolverse mediante sistemas estadísticos que «entrenen» a la máquina con una gran cantidad de datos.

De la sintaxis a la semántica

Un programa muy conocido para el análisis lingüístico es el software Stanford CoreNLP. Ideado por Christopher Manning, de la Universidad Stanford, es capaz de clasi­ ficar frases con todo tipo de informaciones, entre ellas, clases de palabras y referencias dentro de la oración. Tales «anotaciones» también indican si un nombre propio se refiere a una persona, a un lugar o a una organización y si una frase corresponde a una afirmación, una pregun­ ta o una solicitud. En la actualidad existen numerosos documentos «anotados» que, a su vez, sirven como material de entrenamiento para desarrollar métodos e instrumentos novedosos.

Las redes sociales también son una fuente particular­ mente productiva de material del lenguaje natural. El análisis de la forma de expresarse de ciertos usuarios puede ayudar a identificar patrones lingüísticos. En 2015, un equipo dirigido por la desarrolladora de Microsoft Margaret Mitchell descubrió que las personas que, según

2014

La agencia de noticias estadounidense AP ge­ nera de forma automatizada artículos sobre las cifras de negocio de empresas estadounidenses.

2015

Google integra en su motor de búsqueda el sis­ tema de inteligencia artificial RankBrain.

2015/2016

Los minicomputadores Amazon Echo (2015, dere- cha) y Google Home (2016) funcionan sin teclado ni pantalla. Con un micrófo­ no y un altavoz integrados reaccionan a órdenes me­ diante voz e informan al usuario sobre el tiempo, ponen música o piden en­ tradas por Internet.

2016

Tay, el chat de inteligencia artificial de Microsoft, produce mensajes cortos racistas y sexistas tras intercambiar contenidos durante todo un día con personas en Twitter.

2075

Ese año existirán ordenadores con una inteli­ gencia artificial equivalente a la de los huma­ nos, según una encuesta entre expertos llevada a cabo por el filósofo Nick Bostrom.

01 00 11 01 10 10 01 11 01 00 10 01 10 10 11 01 00 10 11 11 01 01 00 10 10 11 00 10 00 11 11 00 10 01 10 11 01 00 11 10 10 01 00 11 01 01 10 10 01 01 11 10 10 10 01 01 01 10 01 00 01 11 10 01 00 11 01 10 10 01 11 01 00 10 01 10 10 11 01 00 10 11 11 01 01 00 10 10 11 00 10 00 1

GEHIRN UND GEIS

T FRMORRISON / CREA TIVE COMMONS B Y.S A 3.0 GOOGLE INC.

sus propias palabras habían enfermado de esquizofrenia, hablaban con mayor frecuencia sobre sí mismas y rara­ mente empleaban signos de exclamación o emoticonos. Esta observación concuerda con dos síntomas usuales de la enfermedad mental: la fuerte preocupación por uno mismo y el afecto plano.

De hecho, determinar el contenido emocional de los textos se ha convertido en una especialidad dentro del procesamiento del lenguaje natural: el análisis del senti­ miento. Pero la mayoría de las herramientas comerciales que ofrecen este tipo de tratamiento se limitan, sobre todo, al análisis de categorías simples (positivo y negati­ vo) o a unas pocas emociones previamente escogidas. Un programa de Microsoft elaborado junto con investiga­ dores de la Universidad Beihang en Pekín combina para ello diferentes elementos sintácticos. Por ejemplo, la oración «La película no es muy buena, pero aun así me gusta», recibe una valoración global positiva tras com­ putar la negación («no»), el refuerzo («muy») y el con­ traste («pero»).

Por lo general, este tipo de sistemas no procesan —o solo de forma limitada— el contexto, aunque ello podría decidir el significado de la oración, subraya Erik Cambria, de la Universidad Tecnológica de Nanyang. La frase «¡Lea usted el libro!» recibe una buena valoración si aparece en el marco de una reseña literaria, no así si surge en relación con una crítica cinematográfica. Por ello, Cam­ bria aconseja interpretar las emociones a partir del sig­ nificado completo del texto en vez de centrarse solo en la sintaxis de la oración. «Los sistemas de la próxima generación precisan de una base más amplia», señala.

Las fases de la lingüística computacional

Según Cambria, el procesamiento del lenguaje natural se encuentra en la segunda de un total de tres fases de investigación que se solapan. La primera, que comenzó en los años cincuenta del siglo pasado, se ocupó prin­ cipalmente de la sintaxis, es decir, del análisis de los elementos de una frase. La segunda, la fase semántica, se centra, sobre todo, en la construcción del significado. «Mientras que en los humanos cada palabra activa una

cascada de conceptos, experiencias y sensaciones simi­ lares, las computadoras deben aprender primero a elaborar relaciones.»

Las redes semánticas contribuyen a ello. El concepto, que surgió en los primeros años de la década de los se­ senta, fue desarrollado veinte años después por Marvin Minsky (1927­2016), considerado una leyenda dentro de la ciencia de la IA [véase «Marvin L. Minsky: el genio de la inteligencia artificial», por John Horgan; Investi­ gación y Ciencia, febrero de 1994]. La comunidad científica intentó construir un banco de datos universal del conocimiento común mediante redes semánticas. En 1985, se dio a conocer en la Universidad de Princeton el programa WordNet, una especie de léxico que agrupa palabras en inglés a partir de relaciones semánticas.

Mas los años siguientes no aportaron los grandes progresos esperados. La lingüística computacional no se desarrolló con la misma velocidad que otras tecnologías. Cambria relativiza incluso los éxitos más recientes: «Si bien el procesamiento del lenguaje natural ha producido inteligencia artificial como los programas Watson, de IBM, y Siri, de Apple, estos no saben lo que hacen». Para lograr que las máquinas comprendan el sentido de lo que repiten como un loro necesitarían un conocimiento empírico práctico. Cambria espera que la tercera fase del procesamiento del lenguaje natural, la pragmática, alcan­ ce su punto álgido a finales del siglo xxi.

Entre los precursores de esta «nueva era» se encuen­ tra Patrick Winston, informático emérito del Instituto de Tecnología de Massachusetts y discípulo de Minsky. En un artículo de 2012 advirtió que quien quisiera desarrollar la inteligencia artificial no debía preguntar­ se si las máquinas podían pensar; mucho más impor­ tante era plantearse qué diferencia el pensamiento hu­ mano del de otros primates, o cómo se engranan las capacidades cognitivas.

Este científico opina que la inteligencia humana nace de la capacidad de contar historias y entenderlas. Por eso, junto con su grupo, ha creado el sistema Genesis, un programa que busca en los textos las relaciones entre episodios o argumentos. De esta manera ha identificado que la obra Macbeth de Shakespeare y la ciberguerra entre Rusia y Estonia contienen un mismo motivo: la venganza. Esta palabra no aparece en los resúmenes analizados por el sistema.

Según un modelo de Erik Cambria, de la Universidad Tecnológica de Nanyang, y Bebo White, de la Universi- dad Stanford, la lingüística computacional se desarrolla

en tres fases análogas a los niveles de comprensión del lenguaje: sintáctico (construcción de oraciones y gramá-

tica), semántico (significado) y pragmático (sentido y uso en el contexto).

Related documents