Banda Ancha EU

Información independiente
sobre fibra, móvil y ADSL

  • 📰 Artículos

¿Google al máximo de su capacidad?

alejandrosantos

La teoría de Anthony Federico vuelve a estar de actualidad. Según ella, Google fue escrita en C y C++ usando ANSI C y Linux (aporta documentación liberada por la propia empresa). El buscador otorga a cada documento un número (un ID del que también hay papers), pero éste sólo puede tomar como valor máximo 4.294.967.296, que es 2 elevado a 32 (32 bites = 4 bytes). El error que se cometió fue asignar a este ID el tipo unsigned long (tipo de variable en lenguaje C que solamente puede tomar valores entre 0 y 4.294.967.296). La cuestión es que desde agosto del año pasado el buscador está indexando 4,285,199,774 web pages. Sólo durante ese agosto de 2.003, veintiun días, había crecido en 1.2 millones de páginas pero lleva un año sin alterarse. ¿Ha llegado al máximo de almacenamiento?.

Anthony Federico, que ya había formulado su teoría aunque no es nueva y que vuelve sobre ella en estos días, pone ejemplos de páginas no indexadas por Google pero que realmente existen. El ejemplo es apabullante. Una búsqueda sobre Cre8pc.com no devuelve resultados aunque la página en cuestión es perfectamente accesible. Por si quedaban dudas, aporta también liberty72.com a la que se puede llegar desde aquí. Además, afirma que pudiera darse el caso de páginas que se añaden y producen que otras se pierdan o, al menos, parte de sus enlaces lo hagan. Lo que es aún más preocupante es que hemos podido comprobar esta ausencia con nuestras propias páginas de reciente creación y algunas páginas ya apuntan que algo raro ocurre.

¿Hay solución?. Según esta teoría seguro que la hay pero advierte de su dificultad de llevar a la práctica debido a los 15.000 servidores que tiene Google y los 4200 millones de documentos a convertir.

Fuente: (link roto) y W3Reports

BocaDePez
BocaDePez

Cierto es k el "contador" de webs no sube, pero yo e puesto este año y ace poco algunas webs en google, y estas an sido indexadas (x ejemplo buscar: www.realwar.ya.st y vereis como sale, o si no "Jedi Academy Clan" (sin comillas)) asi k yo creo k es el buscador k esta jodio, o k estoy borrando alguna web, 1 de 2 ya k si esta al limite, como coño es k me indexan nuevas webs?

🗨️ 1
yatique

Realmente Google desperdicia aun muchos de sus resultados con webs que no han sido actualizadas desde muchisimo tiempo, hablo de AÑOS, paginas que llevan 5 años sin actualizar aun salen ahi, sin contar paginas que desaparecen pinchas en los links y no hay web alguna. Todos esos resultados son prueba de una FALSA optimizacion que nos intentan hacer creer.

Polanko2k

Y eso de adoptar el sistema americano de llamar billon al millar de millon? un billon es un millon de millones osea 1.000.000.000.000 6 ceros por banda por eso se llama BI (dos).

🗨️ 1
alejandrosantos

Un problema con la traducción ya corregido :)

BocaDePez
BocaDePez

LIBRETY72 y CRE8PC me salen en 1a posicion. :D

🗨️ 7
nak

prueba a buscar cre8pc y veras como si salen bien los resultados. esos resultados q ye tu madnas pasan siempre q se añade .com. prueba a buscar si no cualquier otra pagina por su nombre y luego prueba añadiendole .com (o .es o lo q sea)

🗨️ 5
BocaDePez
BocaDePez

google.es/search?hl=es&ie=UTF-8&q=elmundo.es&meta=

Algo extraño ocurre porque deberia aparecer con y sin .com porque con El Mundo ocu8rre. Yo tengo una pagina personal con las fotos de mi boda (un dominio .es.vg) que no aparece ni con sufijo, ni sin el, ni nada. Ademas que alguien me explique porque no se mueve el contador y el problema con Pagerank

🗨️ 2
BocaDePez
BocaDePez

Aquí hay alguno que se va de gurú y no tiene ni idea...

como toda dirección exacta de una página que se introduce en google, dirección exacta (búsquese, www.elmundo.es), google muestra el título de la página y una serie de opciones como...

cre8pc.com/

Google can show you the following information for this URL:

Ahora alguien me dirá que si buscas elmundo.es, te sale la página normal de resultados de google... y es que google no tiene indexada elmundo.es como dirección exacta de la página... repito, probad a buscar con www.elmundo.es, y en cambio con www.cre8pc.com lo tienen registrado como dirección exacta con cre8pc.com (como originalmente era).. lo que pasa, es que ahora cre8pc.com solo funciona con el www. delante (hecho adrede para dejar algo en evidencia a Google??, pero con trampa?)...

da asco los resabidillos que hay por aquí...

barbin

Si quereis saber si Google tiene indexado un stio teneis que usar el comando site

site:dominio

En este caso site:cre8pc.com Si buscais eso vereis que el buscador devuelve 77 paginas para ese dominio. google.es/search?sourceid=navclient&hl=e…cre8pc%2Ecom

Que luego aparezca si buscas por el nombre completo o no, eso es cosa de optimización pero no de que este o no este indexado un dominio en Google.

tonikelope

Yo tengo una página personal con fotos y tal bajo dominio tk y no aparece ni buscando por el nombre exacto (aparece otro smilar pero el mio no) ¬ ¬...

Salu2 ;)

🗨️ 1
BocaDePez
BocaDePez

lo de TK es normalmente un frame html y si no pones, o bien una descripcion o una lista de palabras, dudo mucho que google tenga la "ciencia infusa" como para indexar tu web en el buscador. PD: Si por el contrario lo has pagado y lo tienes apuntando por DNS contra un servidor, pues entonces ya la cosa cambia.

BlackRain

Si la explicacion que dan al supuesto error de programacion de google es correcta... La cagada es incuestionable (por mucho que nos guste o bien que nos caiga el buscador).

Y eso de que páginas que antes no estaban en Google y de repente aparezcan, no podria ser que estuvieran borrando páginas antiguas o poco "buscadas" para añadir las nuevas?

Saludos

sorrillo

Que hagan un filtro que borre todas las webs que contengan las palabras "britney spears naked" y veras como se queda a la mitad :-), con esta solucion seguro que pueden estar unos cuantos siglos mas sin problemas.

Y si quieren ponerse un poco mas radicales pueden hacer el filtro usando la palabra microsoft o bill gates, a mas de uno le haria ilusion jejeje.

Saludos.

🗨️ 2
BocaDePez
BocaDePez

200% de acuerdo contigo sorrillo, eliminando paginas mierda como de "porno de pago" y cosas asi, liberariamos miles de webs innecesarias.

BocaDePez
BocaDePez

Como hagan lo que tu dices, también borraran esta, por listo.

BocaDePez
BocaDePez

esta noticia no tiene fundamentos, ahora mismo google indexa paginas mejor que nunca, antes se necesitaban meses y ahora lo hace en tan solo dias, no se que bobadas decis

nunca habia estado mas contendo con google, si no trabajase de hacer webs no hablaria, pero doy de alta varias webs al mes

🗨️ 1
BocaDePez
BocaDePez

y digo yo no habria sido mas logico usar una variable de tipo double??? en cuanto lo del filtro me parece radical usar ese metodo que la persona que haya puesto esa pagina come como nosotros y le habra cosatado lo suyo conseguir el material que en su pagina de pago oferta , yo digo no a la censura sea del contenido que sea , que retoquen ese algoritmo tan grandioso que tienen ya que preseumen de tener a los programadores mas imaginativos que existen o que pasa que creeis que este algoritmo de google es como la receta de la coca-cola que se invento y ya se puede vivir del cuento, pues por desgracia en el mundo de la informatica NO.
Aunke esta noticia creo ke ha sido sacada de una fuente poco fiable ya que dias anteriores vi otra noticia sobre que google indexaba contenido flash lo cual si es cierto me parece un gran avance al que creo ke habra dejado descolocado a ese nuevo buscador que plantean introducir en el nuevo longhorn de güindows

anthrax

el PageRank que usa el Google para indexar las páginas webs.

Saludos 8)

BocaDePez
BocaDePez

No se que hace esta noticia (a todas luces sin fundamento) en la portada.
A mi me da que lo que pasa es que el tal Federico no tiene ni puta idea de buscar en google, porque tanto liberty72 como Cre8pc aparecen sin problemas

🗨️ 4
BocaDePez
BocaDePez

La excesiva duración de la última Google Dance, o la disminución de los 'backlinks', ¿no te parece raro?

🗨️ 3
Gnz

Ni la ultima Dance ha sido excesivamente larga ni los backlinks se han reducido. Es mas, todo lo contrario.

Google tiene las mejores busquedas del mundo, esta a años luz en calidad del resto de buscadores. Si vais a difamar hacerlo con FUNDAMENTO.

Osea, que todo esto biene por la similitud del numero de paginas indexadas con el limite de ese tipo de variables... ... ... ...
Encima es la segunda vez que se trata esta tonteria. Yo alucino, google indexa mas que nunca.

🗨️ 2
BocaDePez
BocaDePez

Pero me gustaria que me explicaseis porque no varia el numero de paginas indexadas. ¿Se rompio el contador? ;DD

🗨️ 1
BocaDePez
BocaDePez

igual el fallo esta en el sprintf.

BocaDePez
BocaDePez

Pregunta del millon.

Estas seguro que todas las maquinas de Google son de 32bits, porque pienso que tienen muchas de 64bits :-)

Aparte hay librerias GNU/GPL que permiten desde C manejar numeros mucho mas altos que [max unsigned long], aunque el rendimiento empieza a bajar (es logico).

🗨️ 2
BocaDePez
BocaDePez

Si eligieron mal la variable no tiene que ver. Que hagan una conversión de tipos con cast ;DDDDDD

🗨️ 1
BocaDePez
BocaDePez

Si es por un error al declarar las variables, los de Google tenian que haber cogido mejore programadores al hacer el "casting" y dejarse de 'cast' :D

BocaDePez
BocaDePez

Fijate bien anda, desde el año 1999 existe el tipo de datos "long long int" como estandar en ANSI C/C++, por lo que se usan datos de 64 bits llegando a un maximo de 2^64 ;-) Veo que es una tontería esa noticia pero bueno, mirate lo que hay de nuevo en ANSI C 99

(link roto)

Ah, no me digas que tu Visual C++ 6.0 da error con "long long int" porque no cumple el ANSI C 99, sino C89 ;-)

Un saludo y arriba google!

🗨️ 1
BocaDePez
BocaDePez

No significa que esté equivocada ni que nadie la esté defendiendo. Se pone encima de la mesa para debatir. Que sois unos fanáticos ;-) De cualquier forma, nos da igual lo que existiera en 1999 si al escoger el tipo de variable se optó por la equivocada.

jcomas

"documentación liberada" -> debería decir que es un paper de cuando estaban en Stanford.
En C/C++ se puede trabajar perfectamente con tipos de 64 bits aunque el procesador sea de 32 bits. Creo que es excesiva la alarma.

🗨️ 2
BocaDePez
BocaDePez

No digo que sea cierto solo quiero saberlo. Si la variable elegida se queda corta, que mas da que tipos de 64 chuten en 32. Eso es otra cosa, ¿no?

🗨️ 1
jcomas

Si trabajas con tipos de 32 bits en una cpu de 32 bits:
2^32=4294967295 variaciones (el tope que se comenta en el artículo)

Si trabajas con tipus de 64 bits en una cpu de 32 bits:
2^64=18446744073709551616 variaciones

En una cpu de 64 bits pues haría las operaciones aritméticas (ejemplo: sumas) en 1 sola pasada mientras que con una cpu de 32 bits hay que emularlo y tarda un poco más (más pasadas).

BocaDePez
BocaDePez

Pues yo en 9 meses no he conseguido que apareza mi dominio. Lo di de alta en enero en google y no hay manera ni modificando los tag de que aparezca. Esta podia ser una posible explicación.

KailKatarn

Que todo este tipo de noticias se haga cuando sale google en bolsa? ays ... cuando os dareis cuenta de que vivimos en un mundo corrompido en el que la avaricia y la envidia están a la orden del día

BacaDePez

lo facil que es migrar a otro lenguaje o cambiar el tipo de variable y compilar otra vez, a mi entender si esta asi es porque quieren porque es rapido y fiable.

🗨️ 2
BocaDePez
BocaDePez

has dicho: "lo facil que es migrar a otro lenguaje"... Ni de coña. ¿crees que cosas asi son tonterias? Pues entonces "Bienvenido a Microsoft."

🗨️ 1
BacaDePez

si se han migrado aplicaciones mucho mas grandes y complejas poruqe no se puede con un motor de busqueda. (puedes reducir su rendimiento o sus comandos caracteristicas pero si hay que hacerlo se hace). como sabes que el programa esta en un microsoft o esta basado en alguno de sus lenguajes?

BocaDePez
BocaDePez

El motivo de porque no cambia el numero de páginas indexadas en la home de google puede que sea una curiosidad a la que incluso tenga interés buscarle la respuesta. Pero responder a esto así es un absurdo que no hay por donde cogerlo. Como mucha gente ha comentado ya, no solo hay montón de nuevas páginas que se indexan, se buscan y se encuentran sin problemas (lo se de buena tinta que también como algún otro trabajo de esto). Es que si de verdad hubiera un problema, la teoría de los 15000 servidores y los documentos a convertir y la dificultad de esta tarea cae por su propio peso.

Si esto fuera insalvable, ¿quiere decir que actualizar cualquier detalle de google es una tarea costosisima e inadmisible por la compañia? ¿a caso alguien se piensa que el código interno no ha sido modificado desde el principio nunca? ¿que estos 2 genios no pensaron en la posibilidad de que hubiera algún fallo y se pudiera arreglar? O mejor aún, ¿no cayeron en que en el futuro quisieran mejorar el buscador?

Por favor, menos rollo de fanatismos a favor, etc. Por muy compleja que sea su red de servidores, estoy seguro que pueden actualizar lo que quieran como quieran cuando quieran. Y si el problema fuera de la supuesta gravedad de este, además se haría al coste que fuera.

JokMontoya

Desde que Google campa por sus respetos, lo hemos visto maniobrar, alterar el algoritmo de indexado, la valoración del PR, el metodo de actualización desde las miticas GoogleDances hasta la actualización progresiva actual. Es un motor de búsqueda que a diferencia de la mayoria de sus adversarios ha evolucionado constantemente, si no que nos lo digan a nosotros que nos dedicamos a optimizar paginas para obtener posiciones.

El parón en el contador puede deberse a una voluntad de no aumentar la carga del sistema y a un intento de apuntar más a la calidad que a la cantidad. No se sabe, no todo lo que intentaron les salió bién, la actualización Florida fue un desastre que fueron enmendando sobre la marcha. Lo que esta claro que un fallo de ese tipo no dejaría congelado a Google, actualizarían los 15000 servidores progresivamente y no nos dariamos ni cuenta.

Y no soy un fanatico, más bien me revienta la situación monopolista de Google, pero el único motor que competía con Google, el "Fast ", que movía Alltheweb.com fue comprado y eliminado por Yahoo y sustituido por un motor viejo resucitado, reciclado y parcheado, Inktomi, que es lo que ofrece resultados ahora en Yahoo, Alltheweb y Altavista.

BocaDePez
BocaDePez

Haz la prueba. El artículo determinado "the", del inglés, según Google, está en 5.800.000.000 de páginas... eso no puede ser, es imposible, no hay tantas páginas y es imposible que todas estén en inglés.
Curioso, ¿verdad?

🗨️ 1
BocaDePez
BocaDePez

Igual es una tonteria tan simple como que si que sea de 32bits el numero del contador de la home y viendo el revuelo que tiene liao el otro tonto del culo desde hace tiempo pues lo hayan dejado, ya se sabe, siempre es bueno que hablen de uno, aunque sea mal, la "mala" publicidad gratuita no deja de ser publicidad.

BocaDePez
BocaDePez

Buenas.

Deberiais visitar esta pagina: (link roto)

En ella se explica el porqué de que en algunas ocasiones las busquedas realizadas no retornen los resultados esperados.

Saludos.

tonikelope

No sé si os habéis fijado que ahora en el pie de www.google.es pone:

©2004 Google - Buscando 8.058.044.651 páginas web

Salu2 ;)