Banda Ancha EU

Información independiente
sobre fibra, móvil y ADSL

hosting en interdominios

Cerrado

¿Google al máximo de su capacidad?

La teoría de Anthony Federico vuelve a estar de actualidad. Según ella, Google fue escrita en C y C++ usando ANSI C y Linux (aporta documentación liberada por la propia empresa). El buscador otorga a cada documento un número (un ID del que también hay papers), pero éste sólo puede tomar como valor máximo 4.294.967.296, que es 2 elevado a 32 (32 bites = 4 bytes). El error que se cometió fue asignar a este ID el tipo unsigned long (tipo de variable en lenguaje C que solamente puede tomar valores entre 0 y 4.294.967.296). La cuestión es que desde agosto del año pasado el buscador está indexando 4,285,199,774 web pages. Sólo durante ese agosto de 2.003, veintiun días, había crecido en 1.2 millones de páginas pero lleva un año sin alterarse. ¿Ha llegado al máximo de almacenamiento?.

Anthony Federico, que ya había formulado su teoría aunque no es nueva y que vuelve sobre ella en estos días, pone ejemplos de páginas no indexadas por Google pero que realmente existen. El ejemplo es apabullante. Una búsqueda sobre Cre8pc.com no devuelve resultados aunque la página en cuestión es perfectamente accesible. Por si quedaban dudas, aporta también liberty72.com a la que se puede llegar desde aquí. Además, afirma que pudiera darse el caso de páginas que se añaden y producen que otras se pierdan o, al menos, parte de sus enlaces lo hagan. Lo que es aún más preocupante es que hemos podido comprobar esta ausencia con nuestras propias páginas de reciente creación y algunas páginas ya apuntan que algo raro ocurre.

¿Hay solución?. Según esta teoría seguro que la hay pero advierte de su dificultad de llevar a la práctica debido a los 15.000 servidores que tiene Google y los 4200 millones de documentos a convertir.

Fuente: google.dirson.com y W3Reports

Los comentarios más recientes se muestran primero. Haz click sobre un comentario para desplegar/plegar.
      • Cerrado

        si se han migrado aplicaciones mucho mas grandes y complejas…

        si se han migrado aplicaciones mucho mas grandes y complejas poruqe no se puede con un motor de busqueda. (puedes reducir su rendimiento o sus comandos caracteristicas pero si hay que hacerlo se hace). como sabes que el programa esta en un microsoft o esta basado en alguno de sus lenguajes?

  • Cerrado

    BocaDePez BocaDePez
    0

    -1 Sin sentido

    No se que hace esta noticia (a todas luces sin fundamento) en la portada.
    A mi me da que lo que pasa es que el tal Federico no tiene ni puta idea de buscar en google, porque tanto liberty72 como Cre8pc aparecen sin problemas

      • Cerrado

        6

        Ni la ultima Dance ha sido excesivamente larga ni los…

        Ni la ultima Dance ha sido excesivamente larga ni los backlinks se han reducido. Es mas, todo lo contrario.

        Google tiene las mejores busquedas del mundo, esta a años luz en calidad del resto de buscadores. Si vais a difamar hacerlo con FUNDAMENTO.

        Osea, que todo esto biene por la similitud del numero de paginas indexadas con el limite de ese tipo de variables... ... ... ...
        Encima es la segunda vez que se trata esta tonteria. Yo alucino, google indexa mas que nunca.

  • Cerrado

    BocaDePez BocaDePez
    0

    La palabra "the" está en 5.800.000.000

    Haz la prueba. El artículo determinado "the", del inglés, según Google, está en 5.800.000.000 de páginas... eso no puede ser, es imposible, no hay tantas páginas y es imposible que todas estén en inglés.
    Curioso, ¿verdad?

    • Cerrado

      BocaDePez BocaDePez
      0

      Igual es una tonteria tan simple como que si que sea de…

      Igual es una tonteria tan simple como que si que sea de 32bits el numero del contador de la home y viendo el revuelo que tiene liao el otro tonto del culo desde hace tiempo pues lo hayan dejado, ya se sabe, siempre es bueno que hablen de uno, aunque sea mal, la "mala" publicidad gratuita no deja de ser publicidad.

  • Cerrado

    Dificil de creer.

    Desde que Google campa por sus respetos, lo hemos visto maniobrar, alterar el algoritmo de indexado, la valoración del PR, el metodo de actualización desde las miticas GoogleDances hasta la actualización progresiva actual. Es un motor de búsqueda que a diferencia de la mayoria de sus adversarios ha evolucionado constantemente, si no que nos lo digan a nosotros que nos dedicamos a optimizar paginas para obtener posiciones.

    El parón en el contador puede deberse a una voluntad de no aumentar la carga del sistema y a un intento de apuntar más a la calidad que a la cantidad. No se sabe, no todo lo que intentaron les salió bién, la actualización Florida fue un desastre que fueron enmendando sobre la marcha. Lo que esta claro que un fallo de ese tipo no dejaría congelado a Google, actualizarían los 15000 servidores progresivamente y no nos dariamos ni cuenta.

    Y no soy un fanatico, más bien me revienta la situación monopolista de Google, pero el único motor que competía con Google, el "Fast ", que movía Alltheweb.com fue comprado y eliminado por Yahoo y sustituido por un motor viejo resucitado, reciclado y parcheado, Inktomi, que es lo que ofrece resultados ahora en Yahoo, Alltheweb y Altavista.

      • Cerrado

        Si trabajas con tipos de 32 bits en una cpu de 32 bits:…

        Si trabajas con tipos de 32 bits en una cpu de 32 bits:
        2^32=4294967295 variaciones (el tope que se comenta en el artículo)

        Si trabajas con tipus de 64 bits en una cpu de 32 bits:
        2^64=18446744073709551616 variaciones

        En una cpu de 64 bits pues haría las operaciones aritméticas (ejemplo: sumas) en 1 sola pasada mientras que con una cpu de 32 bits hay que emularlo y tarda un poco más (más pasadas).

  • Cerrado

    BocaDePez BocaDePez
    0

    Absurdo desde el principio hasta el final.

    El motivo de porque no cambia el numero de páginas indexadas en la home de google puede que sea una curiosidad a la que incluso tenga interés buscarle la respuesta. Pero responder a esto así es un absurdo que no hay por donde cogerlo. Como mucha gente ha comentado ya, no solo hay montón de nuevas páginas que se indexan, se buscan y se encuentran sin problemas (lo se de buena tinta que también como algún otro trabajo de esto). Es que si de verdad hubiera un problema, la teoría de los 15000 servidores y los documentos a convertir y la dificultad de esta tarea cae por su propio peso.

    Si esto fuera insalvable, ¿quiere decir que actualizar cualquier detalle de google es una tarea costosisima e inadmisible por la compañia? ¿a caso alguien se piensa que el código interno no ha sido modificado desde el principio nunca? ¿que estos 2 genios no pensaron en la posibilidad de que hubiera algún fallo y se pudiera arreglar? O mejor aún, ¿no cayeron en que en el futuro quisieran mejorar el buscador?

    Por favor, menos rollo de fanatismos a favor, etc. Por muy compleja que sea su red de servidores, estoy seguro que pueden actualizar lo que quieran como quieran cuando quieran. Y si el problema fuera de la supuesta gravedad de este, además se haría al coste que fuera.

      • Cerrado

        6

        prueba a buscar cre8pc y veras como si salen bien los…

        prueba a buscar cre8pc y veras como si salen bien los resultados. esos resultados q ye tu madnas pasan siempre q se añade .com. prueba a buscar si no cualquier otra pagina por su nombre y luego prueba añadiendole .com (o .es o lo q sea)

          • Cerrado

            BocaDePez BocaDePez
            0
            lo de TK es normalmente un frame html y si no pones, o bien…

            lo de TK es normalmente un frame html y si no pones, o bien una descripcion o una lista de palabras, dudo mucho que google tenga la "ciencia infusa" como para indexar tu web en el buscador. PD: Si por el contrario lo has pagado y lo tienes apuntando por DNS contra un servidor, pues entonces ya la cosa cambia.

        • Cerrado

          BocaDePez BocaDePez
          0
          http://www.google.es/search?hl=es&ie=UTF-8&q=elmundo.es&meta=…

          http://www.google.es/search?hl=es&ie=UTF-8&q=elmundo.es&meta=

          Algo extraño ocurre porque deberia aparecer con y sin .com porque con El Mundo ocu8rre. Yo tengo una pagina personal con las fotos de mi boda (un dominio .es.vg) que no aparece ni con sufijo, ni sin el, ni nada. Ademas que alguien me explique porque no se mueve el contador y el problema con Pagerank

          • Cerrado

            Si quereis saber si Google tiene indexado un stio teneis que…

            Si quereis saber si Google tiene indexado un stio teneis que usar el comando site

            site:dominio

            En este caso site:cre8pc.com Si buscais eso vereis que el buscador devuelve 77 paginas para ese dominio. http://www.google.es/search?sourceid=navclient&hl=es&ie=UTF-8&q=site%3Acre8pc%2Ecom

            Que luego aparezca si buscas por el nombre completo o no, eso es cosa de optimización pero no de que este o no este indexado un dominio en Google.

          • Cerrado

            BocaDePez BocaDePez
            0
            Aquí hay alguno que se va de gurú y no tiene ni idea... como…

            Aquí hay alguno que se va de gurú y no tiene ni idea...

            como toda dirección exacta de una página que se introduce en google, dirección exacta (búsquese, www.elmundo.es), google muestra el título de la página y una serie de opciones como...

            cre8pc.com/

            Google can show you the following information for this URL:

            Ahora alguien me dirá que si buscas elmundo.es, te sale la página normal de resultados de google... y es que google no tiene indexada elmundo.es como dirección exacta de la página... repito, probad a buscar con www.elmundo.es, y en cambio con www.cre8pc.com lo tienen registrado como dirección exacta con cre8pc.com (como originalmente era).. lo que pasa, es que ahora cre8pc.com solo funciona con el www. delante (hecho adrede para dejar algo en evidencia a Google??, pero con trampa?)...

            da asco los resabidillos que hay por aquí...

  • Cerrado

    BocaDePez BocaDePez
    0

    Creo k google en verdad no tiene ningun problema

    Cierto es k el "contador" de webs no sube, pero yo e puesto este año y ace poco algunas webs en google, y estas an sido indexadas (x ejemplo buscar: www.realwar.ya.st y vereis como sale, o si no "Jedi Academy Clan" (sin comillas)) asi k yo creo k es el buscador k esta jodio, o k estoy borrando alguna web, 1 de 2 ya k si esta al limite, como coño es k me indexan nuevas webs?

    • Cerrado

      Realmente Google desperdicia aun muchos de sus resultados con…

      Realmente Google desperdicia aun muchos de sus resultados con webs que no han sido actualizadas desde muchisimo tiempo, hablo de AÑOS, paginas que llevan 5 años sin actualizar aun salen ahi, sin contar paginas que desaparecen pinchas en los links y no hay web alguna. Todos esos resultados son prueba de una FALSA optimizacion que nos intentan hacer creer.

  • Cerrado

    Y no os resulta curioso ...

    Que todo este tipo de noticias se haga cuando sale google en bolsa? ays ... cuando os dareis cuenta de que vivimos en un mundo corrompido en el que la avaricia y la envidia están a la orden del día

  • Cerrado

    BocaDePez BocaDePez
    0

    Pues yo en 9 meses...

    Pues yo en 9 meses no he conseguido que apareza mi dominio. Lo di de alta en enero en google y no hay manera ni modificando los tag de que aparezca. Esta podia ser una posible explicación.

  • Cerrado

    BocaDePez BocaDePez
    0

    32 o 64 bits?

    Pregunta del millon.

    Estas seguro que todas las maquinas de Google son de 32bits, porque pienso que tienen muchas de 64bits :-)

    Aparte hay librerias GNU/GPL que permiten desde C manejar numeros mucho mas altos que [max unsigned long], aunque el rendimiento empieza a bajar (es logico).

      • Cerrado

        BocaDePez BocaDePez
        0

        Si es por un error al declarar las variables, los de Google…

        Si es por un error al declarar las variables, los de Google tenian que haber cogido mejore programadores al hacer el "casting" y dejarse de 'cast' :D

  • Cerrado

    Pues vaya tonteria de problema

    Que hagan un filtro que borre todas las webs que contengan las palabras "britney spears naked" y veras como se queda a la mitad :-), con esta solucion seguro que pueden estar unos cuantos siglos mas sin problemas.

    Y si quieren ponerse un poco mas radicales pueden hacer el filtro usando la palabra microsoft o bill gates, a mas de uno le haria ilusion jejeje.

    Saludos.

    • Cerrado

      BocaDePez BocaDePez
      0

      200% de acuerdo contigo sorrillo, eliminando paginas mierda…

      200% de acuerdo contigo sorrillo, eliminando paginas mierda como de "porno de pago" y cosas asi, liberariamos miles de webs innecesarias.

  • Cerrado

    BocaDePez BocaDePez
    0

    Y long long int para quién?

    Fijate bien anda, desde el año 1999 existe el tipo de datos "long long int" como estandar en ANSI C/C++, por lo que se usan datos de 64 bits llegando a un maximo de 2^64 ;-) Veo que es una tontería esa noticia pero bueno, mirate lo que hay de nuevo en ANSI C 99

    http://en.wikibooks.org/wiki/Programming:C_Reference_Tables

    Ah, no me digas que tu Visual C++ 6.0 da error con "long long int" porque no cumple el ANSI C 99, sino C89 ;-)

    Un saludo y arriba google!

    • Cerrado

      BocaDePez BocaDePez
      0

      No significa que esté equivocada ni que nadie la esté…

      No significa que esté equivocada ni que nadie la esté defendiendo. Se pone encima de la mesa para debatir. Que sois unos fanáticos ;-) De cualquier forma, nos da igual lo que existiera en 1999 si al escoger el tipo de variable se optó por la equivocada.

  • Cerrado

    BocaDePez BocaDePez
    0

    pffffff

    esta noticia no tiene fundamentos, ahora mismo google indexa paginas mejor que nunca, antes se necesitaban meses y ahora lo hace en tan solo dias, no se que bobadas decis

    nunca habia estado mas contendo con google, si no trabajase de hacer webs no hablaria, pero doy de alta varias webs al mes

    • Cerrado

      BocaDePez BocaDePez
      0

      y digo yo no habria sido mas logico usar una variable de tipo…

      y digo yo no habria sido mas logico usar una variable de tipo double??? en cuanto lo del filtro me parece radical usar ese metodo que la persona que haya puesto esa pagina come como nosotros y le habra cosatado lo suyo conseguir el material que en su pagina de pago oferta , yo digo no a la censura sea del contenido que sea , que retoquen ese algoritmo tan grandioso que tienen ya que preseumen de tener a los programadores mas imaginativos que existen o que pasa que creeis que este algoritmo de google es como la receta de la coca-cola que se invento y ya se puede vivir del cuento, pues por desgracia en el mundo de la informatica NO.
      Aunke esta noticia creo ke ha sido sacada de una fuente poco fiable ya que dias anteriores vi otra noticia sobre que google indexaba contenido flash lo cual si es cierto me parece un gran avance al que creo ke habra dejado descolocado a ese nuevo buscador que plantean introducir en el nuevo longhorn de güindows

  • Cerrado

    Psss

    Si la explicacion que dan al supuesto error de programacion de google es correcta... La cagada es incuestionable (por mucho que nos guste o bien que nos caiga el buscador).

    Y eso de que páginas que antes no estaban en Google y de repente aparezcan, no podria ser que estuvieran borrando páginas antiguas o poco "buscadas" para añadir las nuevas?

    Saludos

1