Por medio de Fernand0 me voy enterando que en NITLE Blog Census han publicado estadísticas, datos y explicaciones de los métodos usados para clasificar el número de weblogs que hay, (y por ejemplo, separarlos por idioma).
Los datos son por demás interesantes e inclusive sorprendentes. Movable Type como la más usada en herramientas “standalone”, Slashdot como el weblog más popular (seguido por Dave Winer y Boing Boing) y lo que a mi más me ha interesado, clasificación de weblogs por idioma, veamos:
- English: 224536
- Portuguese: 50446
- Polish: 38483
- Farsi: 20933
- Spanish: 7826
Siendo más de 15 paises que bloggeamos en español estamos 4 puestos abajo del portugues que son basicamente dos (Brasil, Portugal). A lo cual me viene a la mente una pregunta que dejo abierta: ¿es más importante la cantidad que la calidad? — y no es que diga que los weblogs portugueses no sean buenos, todo lo contrario. Pero que haya una mucho mayor cantidad, ¿significa que hay mejores cosas por alla?
Obviamente Blogger.com.br es el principal culpable de esta gran proliferación de weblogs en portugues. Llevo meses preguntándome porque no ha lanzado Blogger en español, pero estas estadísticas me responden parcialmente.
Por otro lado y lo más importante para mi es que el Idle words cuenta un poco más de 7000 weblogs en español mientras que en Bitácoras.net hay exactamente 1671 weblogs registrados mientras escribo esto.
¿Qué es mejor?
Por un lado Idlewords busca bitácoras como un buscador, no necesita que los autores se inscriban para mostrar que “ahí están”. Pero esto puede prestarse a errores como recopilar sitios que no son bitácoras o muchas que no se actualizan en meses (¡o años!), duplicadas, etc.
Por otro lado el directorio de Bitácoras.net es mantenido por humanos, (que l mayoría del tiempo es Xenia)…Es decir se revisa cada uno de los sitios para ver si está en español, si es actualizado y si efectivamente es un weblog, pero por otro lado…no sabemos cual es el porcentaje de autores que se toma el pequeño trabajo de inscribir su bitácora al directorio.
Yo calculo que solo la mitad de webloggers se inscriben en Bitácoras.net, el Blogómetro registra 2887 weblogs que son recopilados automaticamente por un robot (o crawler), que aunque registra los mismos errores que Idlewords, me confirmaba mis teorías de que solo el 50% de los webloggers se registran en el directorio, pero con este nuevo número de Idlewords…talvez esté totalmente equivocado.
Entonces, repito: ¿qué es mejor? — ¿cómo podemos lograr un punto medio entre la búsqueda de un robot y el análisis de un humano?


La verdad, mas que los portugueses, me ha sorprendido al cantidad tan inmensa de blogs en polaco, que imagino que seran la mayoria de Polonia . Un poco raro no??
¿Cuentan el idioma del host?
Si es así, la culpa la tiene http://www.host.sk.
“¿cómo podemos lograr un punto medio entre la búsqueda de un robot y el análisis de un humano? ”
Pues con un robot que ponga banderas rojas a las páginas que sospecha que no son blogs(basado en un buen número de reglas, claro) , y que luego se las pase a un humano. Y las páginas que pasen todas las pruebas sin banderas rojas, pasan automáticamente.
ojo: no le doy respuesta a tu pregunta :), solo opino como veo la situacion en mi pais, Venezuela.
según CIA - The World Factbook, ambos paises (port y br) suman 186.millones de habitantes para 50 mil blogs .
hay comunidades de webblogers que no postea en los directorios tradicionales, aqui tienes como ejemplo un directorio venezolano,
http://veneblogs.vexweb.com/earlybeta.php
El que haya menos blogs en español es un reflejo de lo golpeadas que estan nuestras economias;
por lo menos en mi pais, no todos pueden adquirir una computadora y menos pagar el acceso a internet,
en mi caso tuve la suerte de cambiar mi equipo en diciembre pasado, si hubiera esperado hasta febrero no habría podido hacerlo ( a raiz del lío polìtico los precios se duplicaron en ese lapso de tiempo).
otro factor las tarifas,los precios del acceso por banda ancha son prohibitivos…mientras en otros paises regalan los cable modems, aqui tienes que comprarlos al igual que en otros paises latinoamericanos.Gracias A pesar de la apertura en telecomunicaciones en el año 2000 han bajado los costos de acceso a internet sin embargo nuestras tarifas se encuentran entre las mas altas de latinoamerica.
El comercio electronico en el pais es incipiente y se acentua mas esa condicion desde enero de este año, las tarjetas de creditos venezolanas estan bloquedas debido a las restricciones impuestas al la compra y venta de divisas por parte del gobierno.
Eso hace que estemos un paso atras en cuanto a las nuevas tendencias en internet.
A pesar de los esfuerzos de los gobierno regionales y nacionales por dotar a las ciudades de centros de navegacion gratuitos y a la proliferacion de ciber cafes ,aun estamos un paso atras en cuanto a las nuevas tendencias en internet… en terminos generales apenas acabamos de “descubrir” el chat ,el correo electronico y lo conveniente que resulta la red para ayudarnos con las tareas escolares .
Bastard, ¿cómo una máquina puede “flaggear” sitios que no esta seguro con exactitud?
¿cómo puedes estar seguro que los weblogs que acepta, son weblogs?
Todo esto trae a colación el tener una definición clara de blog, cosa harto complicada en un mundillo. Para que funcionara el robot habrá que darle creiterios claros:
- ¿que esté hecho con una herramienta adecuada, blogger, movable,20six?
- ¿que tenga comentarios, sindicación y enlaces a otros blogs?
Entiendo que es bastante complicado, ante los datos ofrecidos por los robots mantengo bastante escepticismo, al menos hasta saber que criterio han seguido…
Bueno, me imagino algo como lo que hace MailWasher ó Spybot, (ó tal vez SpamAssasin, pero no estoy seguro de cómo funciona). Un friego de reglas acumuladas que le ayudan a decidir lo que es basura y lo que no. Por ejemplo algunas de las que menciona Cosimo.
Digamos tu página dice hecha con MT, y tiene comentarios, y actualizada cada cuando, y está en español, pues la clasifican como blog.
Joder, no soy programador, sólo he visto que puede funcionar(Hay robots que clasifican páginas porno, por dios :D) , y probablemente sabes más de qué consiste un blog que yo.
Los 2887 weblogs del blogómetro han sido comprobados a mano casi todos, aunque en algunos casos nos hemos fiado de los ‘blogrollings’ de otra gente.
Por supuesto, la lista está a disposición del que la quiera ver o usar: en la web del bllogómetro hay enlaces a ella (aunque no la actualizamos con frecuencia), o por correo, si os resulta más cómodo.
Los datos de idlewords los tenemos en cuarentena: su autor nos los remitió y curioseando entre los que tenía en radio (que no teníanos ninguno de allí) lo que encontramos fueron algunos errores: blogs con pocas palabras en otros idiomas, que habían producido identificadiones incorrectas.
Leyendo los comentarios me da la impresión de que no leyeron la metodología que usa el buen señor de idlewords, que también es pública. Seguramente las decisiones adoptadas por el autor son discutibles, pero primero hay que conccerlas ;)
sexo gay infrmacion