• No results found

Chapter 11. Recommendation and Implementation

11.3. Future considerations

En este punto, nuestras ideas acerca de la comunicaci´on han sido fuertemente influenci- adas por la comunidad de Entendimiento del Lenguaje Natural, especialmente la teor´ıa basada en planeaci´on de actos de discurso. Eventualmente, ser´ıa bueno contar con un sistema de entendimiento completo que realice un reconocimiento de intenciones sobre las palabras del que habla, y formar planes apropiados. Para el escenario, nos concen- tramos en el ´area de identificaci´on referente, igualando los t´erminos del que habla a objetos en el ambiente inmediato del robot. En esta secci´on describimos el sistema de entrada de discurso, y los esquemas que se llevan a cabo, toma de aviso y mandos de tarea.

IV.5.1

Discurso de entrada

Un sistema de reconocimiento de discurso excelente es el desarrollado en SRI, llamado CORONA. CORONA tiene modelos de reconocimiento independientes del que habla que no necesita entrenamiento, aunque tendr´a mejor exactitud con modelos individ- ualmente sintonizados. CORONA acepta una gram´atica BNF de frases, y produce cadenas de palabras habladas. En una computadora Sparc 10-51, opera cerca de dos veces el tiempo real en la gram´atica simple que usamos, i.e., una sentencia de 5 segun- dos tomar´ıa cerca de 10 segundos para su reconocimiento.

Unos de los m´as duros problemas en la comunicaci´on de voz es hacerle saber al supervisor cuando Flakey ha escuchado una palabra, y lo que el estado de su en- tendimiento es. Emplearon varias t´ecnicas:

Clave. Puede haber muchos extra˜nos parloteos durante las interacciones. La gram´atica fue creada con una palabra clave inicial, de manera que s´olo las

frases que empiezan con la palabra “Flakey” son reconocidas. Esto trabaja ex- tremadamente bien; es natural dirigir mandos y sentencias al robot en esta forma. Una buena caracter´ıstica adicional ser´ıa utilizar una interpretaci´on direccional de fuentes de sonido para obtener la atenci´on de Flakey.

Estado del proceso. CORONA utiliza un “apuntador final”, un periodo de energ´ıa de discurso baja, para se˜nalar el fin de una frase hablada. Desde este punto hay un retraso hasta que el discurso es procesado; el que habla puede ser confundido acerca de cuando su estrada fue recibida, y cuando fue reconocida. Implementa- mos una simple bandera de final de discurso; Flakey dice “um” cuando el punto final es alcanzado. As´ı el que habla puede decir que su entrada fue recibida y esta siendo procesada.

Resultados. Es importante dar una retroalimentaci´on al que habla acerca de la inter- pretaci´on de su entrada. Por ejemplo, si el que habla dice “vuelta a la izquierda”, y es interpretado como “ve hacia delante”, el que habla ser´a mitificado por el com- portamiento del robot. De modo que Flakey reconocer´ıa cada mando hablado, tambi´en parafraseandolo, o moviendo sus camaras en reconocimiento. Si la frase no fue reconocida, Flakey dir´a “Qu´e?”.

IV.5.2

Gestos

Tambi´en el reconocimiento de gestos forma parte del proceso de atenci´on. La idea fu´e usar una mezcla de discurso y gestos para referencia, e.g., “Esta oficina (apuntando a la derecha o izquierda) es de Karen”. Se efectu´o un manejo para extraer suficiente informaci´on del sistema estereo, para reconocer los brazos apuntando a la izquierda o a la derecha, pero no se tuvo suficiente tiempo para integrarlo correctamente con el discurso de entrada, incluso para referencia simple. Esto ser´ıa un buen proyecto para

trabajo futuro, con un m´as elaborado sistema de entendimiento de lenguaje natural.

IV.5.3

Movimiento directo

Estos son mandos directos para mover hacia delante o voltear, o mirar (mover las c´amaras) en cierta direcci´on, e.g., “mira detras de ti”. Mandos de movimiento directo son implementados como una secuencia simple de comportamientos con condiciones de terminaci´on bien definidas y tiempos fuera cortos. Por ejemplo, si a Flakey se le dice que se mueva hacia delante mientras se orienta a la pared, se voltear´a hacia la pared y se mover´a hacia delante cerca de un metro, ya que la evasi´on de obst´aculos est´a activa todo el tiempo. Ser´ıa m´as inteligente, por supuesto, reconocer que no es posible moverse hacia delante, y detener este hecho.

IV.5.4

Atender y seguir

Estos mandos envuelven coordinaci´on de sondeo y acci´on, mediados por artefactos en el EPL. Incluso esquemas de actividades muy simples, cuando est´an coordinados con el sondeo, pueden dar la apariencia de un robot bien entrenado con habilidades humanas. El esquema de Atender encuentra objetos parecidos a personas y llevan a Flakey orientado a la persona y a una distancia de un metro. El mando “mirame” o “encuen- trame” provoca este esquema. Flakey realiza un escaneo desde la posici´on actual de la c´amara al extremo izquierdo y derecho de la cabeza pan/tilt, dado un campo de visi´on completo de 360 grados. El primer objeto persona detectado por el algoritmo estereo de seguimiento se coloca en el EPL, y un esquema de actividad posiciona al robot orientado al objeto y mantiene las c´amaras centradas en la persona. El ´exito del esquema Atender se indica cuando dice “Aqu´ı estoy”; la falla, despu´es de un escaneo completo, por un “No puedo encontrarlo!”.

Algoritmos gen´eticos

V.1

Introducci´on

En este cap´ıtulo, se introduce al tema de los algoritmos gen´eticos: qu´e son, de d´onde vinieron, y c´omo se comparan o diferencian de otros procedimientos de b´usqueda. Se Ilustra c´omo trabajan, y se iniciar´a por entender su poder a trav´es del concepto de un esquema o plantilla de similaridad.

Related documents