
Google asaltó nuestras vidas hace tan poco tiempo que, creo, aún no tenemos suficiente perspectiva histórica para evaluar las consecuencias. Eso sí, tenemos números duros que dan cuenta de la pisada gigantesca de la empresa, como sus miles de servidores web basados en Linux, sus petabytes de información indexada, sus gastos energéticos, etc. Sin embargo, poco se habla de su aportación a la ciencia. Pero, ¿cómo medirla? En la práctica tenemos varias métricas. En lo que respecta a este post usaré un parámetro cuantitativo: el número de artículos científicos, o papers, publicados por área. Y aquí los tienen:
- Algoritmos y teoría: 221 artículos
- Aprendizaje de máquina: 180 artículos
- Procesamiento de lenguaje natural: 140 artículos
- Sistemas distribuidos y cómputación paralela: 141 artículos
- Percepción de máquina: 116 artículos
- Seguridad, Criptografía y Privacidad: 112 artículos
- Inteligencia artificial y minería de datos: 97 artículos
- Interacción Hombre-Máquina y Visualización: 96 artículos
- Obtención de información: 75 artículos
- Ingeniería de software: 61 artículos
Para quienes no lo sepan, cuando un artículo científico es aceptado y publicado (en revistas científicas, journals, conferencias, entre otros medios), es porque ha pasado por el escrutinio riguroso de varios árbitros expertos en el tema. Y antes siquiera de ser enviado, el artículo involucra meses de investigación de uno o más personas de uno o más grupos de investigación, según la dificultad. En particular, esos números corresponden a la investigación de los googlers a la fecha.
Más allá de los números, ¿qué tipo de conocimiento genera Google? Uno pensaría que está dirigido a sistemas distribuidos y web. Y es cierto a decir por sus productos. Pero el conocimiento de base es, por mucho, algorítmico. Algoritmos para hacer de todo encima de Internet y la Web. Entre ellos algunos vinculados directamente con la publicidad en línea, con todo y sesudos modelos matemáticos, que pongo aquí sólo para ejemplificar:
- Adapting Online Advertising Techniques to Television
- Incremental Clicks Impact Of Search Advertising
- Advertising and Traffic: Learning from online video data
Aunque con un punto de vista más general, son cuatro las grandes áreas de conocimiento que sostienen Google: Inteligencia artificial, ingeniería de software, seguridad y sistemas distribuidos. Desde mi punto de vista, Google vive de la inteligencia artificial, área a la que pertenece su algoritmo fundacional, el PageRank. Así que es natural encontrar esa cantidad de papers sobre aprendizaje y percepción de maquina, seguramente aplicados a sus bots, y los de procesamiento de lenguaje natural que sugieren que Google tiene como prioridad expandir hacia allá su interfaz de búsqueda con voz, nuestra voz.
Google, como cualquier gran empresa de tecnología que se precie de serlo, genera conocimiento a lo largo del tiempo. Lo llevan haciendo así los gigantes IBM y Bell Labs desde el siglo pasado. Este es el total de artículos de aquellas y otras áreas repartidos por año:

- 2011, 183
- 2010, 257
- 2009, 303
- 2008, 251
- 2007, 209
- 2006, 130
- 2005, 56
- 2004, 17
- 2003, 13
- 2002, 5
- 2001, 5
- 2000, 3
- 1999, 2
- 1998, 3
Ciertamente, su producción científica aumentó con escala exponencial, aunque, por alguna razón, bajo un poco los últimos dos años (a tomar en cuenta que faltan datos de 2011). Como sea, no hay visos de que la maquinaría de la gran G se detenga, por el contrario, se nota bien afinada por docenas de doctores en ciencias en cada piso de su Googleplex.
Google contrata genios de vez en cuando para dirigir su grupos de investigación. Y es un ejemplo de que el capital más importante está en el conocimiento generado y el potencial, que está por venir. Quién sabe, tal vez en menos de 10 años Google tendrá su primer Nobel. Habrá que verlo. En tanto, espero que lo datos referidos aquí nos ayuden a dimensionar mejor sus aportaciones a la ciencia.










Sería bueno comparar esto con los paper producidos por empresas como IBM, Xerox, HP y ya que estamos, con Facebook… así el dato aislado no dice mucho.
¿Y cuales serían los parámetros de comparación?
por ejemplo, cantidad de articulos cantidad de investigadores en su planta, relevancia de los articulos publicados, etc.
Cool, y si se compararan con los papers que genera Apple?
Uniros. Reponded con el mensaje: “Me niego a comentar o registrarme en Facebook”. Prefiero como era antes, sin mordazas!!
Uniros. Reponded con el mensaje: “Me niego a comentar o registrarme en Facebook”. Prefiero como era antes, sin mordazas!! Tanto que vais de libertad ahora limitáis con numero de letras!
A que viene tu comentario no le veo ninguna relación con el tema.
Es interesante solo que me parece que falta mas información sobre las investigaciones que realizaron y aportaron algo con gran impacto, se que muchas de ellas lo han echo pero habrá algunas con mayor impacto. por lo demas esta bien informar que en google no todo es competencia….
Honestamente realizas una pésima traducción de los nombres en inglés de los tópicos en cuestión. Si no tienes experiencia con terminos científicos usados, mejor mantenlos en su idioma original.
Ayuda aportando algo, no hay pex, sacanos de nuestra ignorancia.
Aprendizaje de máquina es Machine Learning y usualmente se traduce como Aprendizaje automático. Percepción de máquina es una pésima traducción Machine Perception. Sólo por mencionar los más obvios.
Además, creo que la situación se agrava si tomas en cuenta que el autor se autodescribe como profesor universitario de Ciencias Computaciones :S
También “obtención de información” se corresponde con “information retrieval” cuya traducción más apropiada es “recuperación de información”…los tópicos están en http://goo.gl/i1x2
No obstante, estimada Lauren, no creo que sea necesaria la dureza en la observación, perfectamente puede hacerse en mejores términos(-más amables- puedo sugerir?): “pesima” -> “inexacta” (x ejemplo)
Por cierto en español criptografia se referiria a dibujar criptas(lapidas) lo correcto en español es cifrado
Deberíais de utilizar más el buscador de Google, descubríais grandes cosas.
¿Nobel? salvo el de la paz, no veo una solo categoria de su investigacion que pudiese ser galardonado con un Nobel
Está el premio Turing de ACM, pero en todo caso no creo que sea google como empresa, sino algún investigador de renombre vinculado a ésta.
“Google: 10 áreas de mayor APORTE a la ciencia”.
Me niego a comentar o registrarme en Facebook
Es el resultado de tener 1 departamento de investigación en una empresa. Ese grupo de doctores puede crear productos con gran motivación científica y beneficio económico. Por ejemplo, kinect nació así
Se habla demasiado bien de “publicar un artículo”; mientras que es sabido que el procedimiento es completamente falaz, el nombre o institución pesan mucho más de lo que está realmente escrito.
Creo que falta algún parámetro de comparación, quizás alguna empresa actual que este al nivel de competir con esta, pues para ser sincero y como no sabía del tema, me parece que es bueno que existan esta cantidad de investigación desarrollada por Google, así sin más me parecen buenos números, pero me gustaría tener un punto de referencia para saber en donde se sitúa.
Juan Carlos: criptografía puede tener más de un significado en español, tanto escritura en criptas como el término informático, al igual que perico es un ave, herramienta, dulce, etc, todo depende del contexto en que se use.