22 noviembre 2006

Frustrante Lenguaje Natural: El abismo del PLN


Los interfaces con lenguaje natural no acaban de funcionar. Son frustantes.



Imaginaros que os dicen: Esto es una aplicación cultural que sabe todo sobre la edad de oro de la literatura española, o que esto es un banco online que permite que opereis y pregunteis y que os dan una caja de texto:Para que pregunteis lo que se os ocurra.

Puede esto funcionar? Que va a preguntar el navegante? Las preguntas pueden pretender de todo, desde pedir datos a secas, invocar una funcionalidad, pedir una opinion, etc. Lo único que sabemos es que son preguntas y que el usuario espera una respuesta. Además, que entendamos la pregunta, y la respondamos con el dato preciso, no significa que el usuario esté encantado.

Hay de todo (para nada exhaustivo):
  • "Poetas Andaluces": Ambigo como casi todo. Como lo interpretas? Los que nacieron en Andalucía, los que vivieron allí, escribieron sobre ella? Pues el sistema devuelve todas las personas, etiquetadas como poetas que tuvieron algo que ver con Andalucía en su vida u obra. Pues el usuario contentísimo. (Claro, acostumbrado a Google, con 1.000.000 resultados en 0,1 segundos)
  • "Mi saldo": Pues hijo, la aplicación no tiene login, por tanto, si te devuelve tu saldo algo va mal con la seguridad del banco y mejor date de baja. Pues para averiguar que algo está fuera del alcance y dar una explicación un poco amable, estas obligado a entenderlo. Y ya que lo entiendes lo haces, no?!
  • En otra aplicación sobre relaciones internacionales que estuvo abierta al publico en el autobús del W3C, la pregunta más frecuente era: "Quién es la más guapa". Para tirarse de los pelos.

La impresión general es frustración.

Problemas que tenemos:
  • Teclear es un rollo. Con google, metiendo una sola palabra y luego navegando, se tarda menos. Todavía nadie supera eso o el flamenco (queries con clicks)
  • No sabemos transmitir que tipo de preguntas se pueden hacer. El usuario preguntará cualquier cosa, tenga o no tenga que ver con el dominio. Para empezar, el usuario solo sabe que la aplicación es sobre "cultura" o es un "banco". A partir de allí puede ser majo y preguntar algo relacionado. Pero preguntas tipo: Porqué, Cómo, Calculame el ... Son las imposibles. Como transmitirlo?
  • Por que, leches, devuelve lo que devuelve. Que me ha entendido? Que sabe? Como lo tiene conectado? Por qué cuando le pregunto "Quién influyó en Picasso" me devuelve a "Maar"? Es como si pregunto "Sabe que hora es?" y me dicen "" y se van. Puñetera pragmática.
Bueno, saber los problemas ya es un paso. Ya podemos proyectar puentes que acerquen el lado humano, con la machine.....Con un poco de morfología, algo de shallow parsing, y algo de modelos podemos intentar cruzar....A ver la leche q nos vamos a dar.

14 noviembre 2006

Subvenciones europeas, dinerito fresco


Estoy en plena epoca de revisiones de proyectos Europeos. Un epoca de mucho trabajo, donde intentas hacer en 3 días, para lo que tenías 3 años.

Los proyectos europeos son subvenciones de la comisión europea para proyectos de investigación. Se conceden varios (decenas) millones de euros a consorcios de empresas, centros de investigación y universidades para investigar e innovar en algún tema que la comisión considera prioritario.

Lo que es una risa, son la revisiones. Es cuando el consorcio debe justificar el gasto del presupuesto ante la comisión europea que puede aprobarlo o recharazlo (y obligar a devolverlo). Los revisores son gente externa que ha tenido 3 días para leerse mas de cien mil folios, y que con suerte tiene alguna idea del tema del proyecto. Ademas la revisión dura 2 días, presentación tras presentación (viva el powerpoint) y algunas demos que fallan por norma.

El resultado suele ser positivo. Los revisores tienen obligaciones ponerle pegas, para que no se diga. Y las ponen, en algun tema al azar (normalmente).

Por parte del consorcio, las empresas, centros y universidades es tiempo de trabajo frenético. Desarrollo orientado a parches a toda leche. Se hace un apaño en 1 semana, lo que debió ser el trabajo coordinado y fructífero de 3 años. Al final cuela.

A pesar de todo esto, los millones de euros han valido la pena. Todo el jeleo colateral, los documentos, los contactos, las pajas mentales, las pruebas de concepto es fructífero. Con que encuentre un poco de sentido comun y ganas en la empresa de turno, pueden salir cosas chulas, pueden disminuir la barrera de entrada en alguna tecnología o sector o sacar un producto chulo. Los resultados no son tangibles como para ser presentados en un ppt en 2 días. Pero valen la pena.

La alternativa? Que el DARPA europeo (que no tenemos) nos dé 10 veces más dinero por hacer desarrollos militares que funcionen de perlas. Y la verdad que prefiero lo nuestro. Venga, todos a por la siguiente subvención!

04 noviembre 2006

A las trincheras...

(otro post de divagación sobre Google)

Los de Google están imparables, eso lo sabemos todos. Sin olvidar, que son una empresa de soporte publicitario (como los que venden el espacio de un billboard), parece increible que hagan las cosas que hacen.

A donde quieren llegar? A tener el monopolio del software en ordenadores (cuando los NetComputers sean realidad). Es esa su estrategia? Hagamos un sistema operativo, una suite de programas básicos, hagamosnos con el contenido y su soporte en la red de tal manera que un usuario tendrá dentro de 10 años solo dos opciones:

i) Comprar software pesado: Windows + Office, suscribirse a contenidos que valgan la pena en internet y vivir pagando.
ii) Usar la suite Google que es gratis, ligera y ademas da acceso a contenidos chulos, pero te comes su publicidad.

Es esta su vision? Quieren desbancar a Microsoft? (menos mal que hay alguien q puede hacerlo, ahora que Oracle va a enterrar a RedHat).

Pues tambien tienen otro frente abierto, la sectorización. A demás de hacerse con contenidos de propósito general (libros, mapas, artículos, noticias, etc.) tiene pinta que quieren especializarse, de la misma manera que lo hace yahoo! (food, financial, sports, etc.). De verdad quieren entrar en la informática industrial quitando el negocio a empresas de desarrollo de proyectos?

Ya ofrecen el mail, blogs, buscadores, etc. para empresas, además de manera que ni siquiera necesitan una mímina infraestructura de servicios para implantarlo. Es cuestion de tiempo que saquen cosas especializadas para ayuntamientos, bibliotecas, bancos, etc. Que lo implante el propio cliente, para eso es gratis y fácil.

Desaparecerán las empresas de informática y los departamentos de informatica? Si todo lo da google, gratis y facil de usar, no hay mas mercado para ganar dinero.

Hasta ahora la única estrategia posible (para los que no nos llamamos Bill Gates) era atrincherarnos en el cliente o sector que conocemos. Como estamos a pie del cañon, y nos conocemos las necesidades de nuestro cliente mejor que él mismo, podemos hacer un proyecto mejor, y ademas hasta cobramos por él.

Pero ya se notan presiones. Que haces si el cliente te pide un mapita como el de google maps? Se lo vendes? Se lo reimplementas? O le enseñas a usar google maps (que son 3 días de formación)?

Vencer por innovación? A que no hay huevos a sacar un producto mas innovador que los juguetes de google....Tienen miles de personas vigilando la red en busca de cosas chulas y otros miles pensando en pajas mentales para que otros tantos miles de equipos las implementen por si valen la pena....Compite con eso y ademas paga tu hipoteca si tienes lo que hay que tener....

Donde van? Que quieren? Cargarse la informática?

P.S: A veces para consolarme me convezco que al final no son mas que las páginas amarillas de la red....y con eso no dominas en mundo....
P.S: Ya tengo teclado castellano, pero algunos diacríticos y tildes paso de ponerlos....a ver si aprendo a escribir.