Read the Web es un proyecto de investigación de la Universidad Carnegie Mellon --una de las más pretigiosas a nivel mundial en Ciencias de la Computación-- que tiene el objetivo de

> construir un sistema de aprendizaje perpetuo que adquiera la habilidad de extraer información estructurada a partir páginas web no estructuradas. De ser exitoso, el resultado será una base de conocimientos de información estructurada [...] que reflejará el contenido de la Web.

Dicho sistema lleva por nombre NELL (_Never-Ending Language Lerner_). El cual está en ejecución, y sin interrupciones, desde enero de este año. Son dos la tareas básicas que lleva a cabo cada día:

1. "Lee": extrae _hechos_ que obtiene de cada una de las millones de páginas web que visita.

2. "Mejora": cada día intenta obtener _hechos_ aún más precisos de la web. Es decir, "aprende a leer mejor que ayer".

Por razones obvias, NELL ha tenido una presencia destacada en los medios. Los creadores han sido objeto de entrevistas en el NY Times, Science Blogs e io9. Incluso el tema ha merecido una portada en Menéame. Es más, NELL es financiado por Google, DARPA, Yahoo!, entre otros.

Con una base 500.000.000 de páginas web, NELL ha aprendido _hechos_ como estos:

* "system Microsoft" es un software (100% de confianza).
* "richard stallman" es un CEO como tantos otros (99%).
* "ALT1040" es un blog (50%).

Vista de otra manera, NELL es una máquina de software que intenta _ordenar_ el caos de (des)conocimientos dispersos y redundantes que existen a lo largo y ancho de la Web. Tal _orden_ queda depositado según reglas precisas dentro de la misma Web en una base de datos con conocimiento puntual, pero que no podemos considerar fiable al 100% --de hecho, obtuvo un 74% a los 67 días, y un 87% a los 6 meses de estar en funcionamiento.

Y es que si NELL aprende de lo que lee, ¿qué podría obtener de sitios como Facebook, Twitter, 4chan, Hi5?

En el futuro probablemente veamos robots de software construidos encima de otros NELL más sofisticados. Quizá sean capaces de aprender a construir Wikipedias, incluso aportar conocimiento a ellas. Lo cierto es que con NELL nace una nueva generación de agentes de software especializados en el aprendizaje. Y aunque aún hay mucho por hacer, NELL ya nos coloca en el umbral de la Web.

Recibe cada mañana nuestra newsletter. Una guía para entender lo que importa en relación con la tecnología, la ciencia y la cultura digital.

Procesando...
¡Listo! Ya estás suscrito

También en Hipertextual: