Atentos Google y Microsoft: Un chileno a la carga.

¡Qué orgullo más grande para mí, comenzar mi actividad en este blog con un notición como éste!

Sí, la emoción es justificada, el chilenismo me embarga, porque si es chileno, es bueno. Como lo leen: Google, Microsoft y otras grandes empresas que han invertido dinero en el negocio de las búsquedas Web ya no podrán decir que sus algoritmos son los más avanzados del mundo.

Un chileno, llamado Rodrigo Fuentealba, y de quien hemos tenido varias noticias en la Internet por su participación como exponente en varios encuentros en Chile y en el extranjero, ha sido seleccionado con una beca completa en la Universidad de Cambridge, debido a que diseñó un sistema más eficiente, más rápido y que consume menos tiempo de procesador que Google.

El sistema se basa en un parser HTML simple que primero organiza el código HTML, asigna un índice por frases y palabras, estableciendo con esta información las proporciones estadísticas. Cuando alguien consulta, en vez de ir a buscar la palabra a una base de datos, sólo necesita el índice estadístico generado como una clave para obtener los resultados deseados. En números, una máquina común de escritorio ha podido almacenar 400.000 páginas de contenido puro con alrededor de 2.000.000 de palabras distintas, discriminadas por idioma y que se intenta discriminar por contexto.

El page ranking se realiza a través de la cantidad de enlaces contenidos en un sitio Web y por los cuales se organizan de manera inteligente los sitios más visitados en función de la contextualización (a través de un algoritmo simple).

“Generar números flotantes” – nos cuenta Rodrigo – “es la mejor forma de generar búsquedas utilizando estadísticas. Es inútil que el procesador pierda tiempo en buscar cada palabra y descomponerla, eso debería ir a un proceso aparte. Además, la manera en que esto se pensó obliga a las personas a escribir código HTML válido y a disminuir el uso de páginas completamente escritas en Flash, que tanto atentan contra los usuarios.”

Es de esperar que nuestro buen representante del código abierto nos deje bien parados y sigamos teniendo noticias de él. Por lo demás, el código fuente de la comprobación del algoritmo, así como el modelo de datos conceptual y todo eso estará publicado hoy a eso de las 11 de la mañana.

http://www.viddler.com/explore/RickRoll/videos/1/12/

15 thoughts on “Atentos Google y Microsoft: Un chileno a la carga.

  1. Hola, bienvenido y felicitaciones por tu primer post, aunque el título me parece algo exagerado, no creo que esos gigantes estén en jaque…o debe ser que tiendo mucho a Google. =)
    Por otra parte, habría que ver el detalle del sistema, ya que para mi, que sea mas rápido y consuma menos tiempo de procesador no lo convierte necesariamente en mejor (desde el pto. de vista de un usuario común y corriente) que lo que hoy en día nos ofrece MS y G. Genial que un chileno logre ese tipo de cosas, pero de ahí a ponerlo en práctica y estar por encima de MS/G, le daría sus dudas.

    Saludos.

    Me gusta

  2. Hola, muchas gracias. Y sí, el título del post es un poco sensacionalista.

    El hecho de que haya un algoritmo más eficiente y que consuma menos recursos es que permite ser utilizado al interior de organismos tales como bibliotecas digitales y empresas de ingeniería, donde la indización de información muchas veces es un problema.

    Además, no creo que un código fuente liberado bajo open source sea aplicable a un proyecto de gran envergadura como ya lo es Google. Habrá que ver qué uso se le da y todo eso. Por algo es “investigación”.

    Saludos.

    Me gusta

  3. Pfff chilenito…ya tenía mis dudas q el aporte fuera asi de bueno…sin desmerecer los excelentes aportes de nuestros compatriotas que trabajan para Canonincal, Novell, y las decenas q aportan en otros proyectos libres.

    Dia de los inocentes…que es eso? =S Todavia se preocupan de eso? Plop.

    Me gusta

Responder

Introduce tus datos o haz clic en un icono para iniciar sesión:

Logo de WordPress.com

Estás comentando usando tu cuenta de WordPress.com. Cerrar sesión / Cambiar )

Imagen de Twitter

Estás comentando usando tu cuenta de Twitter. Cerrar sesión / Cambiar )

Foto de Facebook

Estás comentando usando tu cuenta de Facebook. Cerrar sesión / Cambiar )

Google+ photo

Estás comentando usando tu cuenta de Google+. Cerrar sesión / Cambiar )

Conectando a %s