22 noviembre 2006

Frustrante Lenguaje Natural: El abismo del PLN


Los interfaces con lenguaje natural no acaban de funcionar. Son frustantes.



Imaginaros que os dicen: Esto es una aplicación cultural que sabe todo sobre la edad de oro de la literatura española, o que esto es un banco online que permite que opereis y pregunteis y que os dan una caja de texto:Para que pregunteis lo que se os ocurra.

Puede esto funcionar? Que va a preguntar el navegante? Las preguntas pueden pretender de todo, desde pedir datos a secas, invocar una funcionalidad, pedir una opinion, etc. Lo único que sabemos es que son preguntas y que el usuario espera una respuesta. Además, que entendamos la pregunta, y la respondamos con el dato preciso, no significa que el usuario esté encantado.

Hay de todo (para nada exhaustivo):
  • "Poetas Andaluces": Ambigo como casi todo. Como lo interpretas? Los que nacieron en Andalucía, los que vivieron allí, escribieron sobre ella? Pues el sistema devuelve todas las personas, etiquetadas como poetas que tuvieron algo que ver con Andalucía en su vida u obra. Pues el usuario contentísimo. (Claro, acostumbrado a Google, con 1.000.000 resultados en 0,1 segundos)
  • "Mi saldo": Pues hijo, la aplicación no tiene login, por tanto, si te devuelve tu saldo algo va mal con la seguridad del banco y mejor date de baja. Pues para averiguar que algo está fuera del alcance y dar una explicación un poco amable, estas obligado a entenderlo. Y ya que lo entiendes lo haces, no?!
  • En otra aplicación sobre relaciones internacionales que estuvo abierta al publico en el autobús del W3C, la pregunta más frecuente era: "Quién es la más guapa". Para tirarse de los pelos.

La impresión general es frustración.

Problemas que tenemos:
  • Teclear es un rollo. Con google, metiendo una sola palabra y luego navegando, se tarda menos. Todavía nadie supera eso o el flamenco (queries con clicks)
  • No sabemos transmitir que tipo de preguntas se pueden hacer. El usuario preguntará cualquier cosa, tenga o no tenga que ver con el dominio. Para empezar, el usuario solo sabe que la aplicación es sobre "cultura" o es un "banco". A partir de allí puede ser majo y preguntar algo relacionado. Pero preguntas tipo: Porqué, Cómo, Calculame el ... Son las imposibles. Como transmitirlo?
  • Por que, leches, devuelve lo que devuelve. Que me ha entendido? Que sabe? Como lo tiene conectado? Por qué cuando le pregunto "Quién influyó en Picasso" me devuelve a "Maar"? Es como si pregunto "Sabe que hora es?" y me dicen "" y se van. Puñetera pragmática.
Bueno, saber los problemas ya es un paso. Ya podemos proyectar puentes que acerquen el lado humano, con la machine.....Con un poco de morfología, algo de shallow parsing, y algo de modelos podemos intentar cruzar....A ver la leche q nos vamos a dar.

No hay comentarios: