Hace 16 años | Por kaleborroka a google.dirson.com
Publicado hace 16 años por kaleborroka a google.dirson.com

Despues de mucho tiempo haciendose las victimas, parece que a la SGAE sí que le importa que su web aparezca en las primeras posiciones cuando buscamos "ladrones" en Google (http://www.google.es/search?hl=es&q=ladrones). Por eso han puesto un fichero "robots.txt" (http://www.sgae.es/robots.txt) para intentar que Google no les rastree.

Comentarios

fermentito

Lo bueno es que no hace falta que salgan en google para que la gente sepa lo que son.

hubutu

#7: lol

Esto me suena a la pelicula "La Terminal" en la que el poli del aeropuerto quiere que Tom Hanks se vaya del aeropuerto aunque su obligacion sea la de tenerle en el aeropuerto.
- Google quiere que la SGAE deje de aparecer en la busqueda de "ladrones" porque es un marrón para ellos
- La SGAE no se entera de nada y sigue apareciendo
- Google le dice a Dirson que les muestre la salida del aeropuerto
- La SGAE sigue sin enterarse de nada lol

D

Me devuelve "Página no encontrada" cuando pongo www.sgae.es/robo.txt

D

jajajaja, mirad que pone (espero no tenga copyright):

User-agent: * # aplicable a todos
Disallow: # permite la indexacion de todas las paginas

No valida, no sirve de nada... a ver... si no quieren recibir errores del tipo 404 no encontrado en el log de apache porque los buscadores buscan ese archivo, lo normal es crear un robots.txt vacío.

Más información sobre eso en: http://www.robotstxt.org/

v

Como ya tenían robots en sus filas (Lapi-ra-te-rí-a-es-ma-la-bipbipbip-), ahora los meten también en su web.

nflamel

Esto solo demuestra lo que ya se sabe desde hace mucho tiempo. La SGAE no tiene ni por asomo el más mínimo conocimiento de como funciona Internet. No saben como funciona la sociedad que lo hace funcionar, pero es que tampoco conocen la tecnología sobre la que funciona... no sé yo que es peor.

D

Esto es provocación por lo menos

T

User-agent: google-spider (o como se llame)
Disallow: http://www.sgae.es/search/search-es.jsp?texto=%3Ch1%3ESomos%20unos%20ladrones%20salgamos%20primeros%20en%20google%20o%20no%3C/h1%3E

Si hubiesen puesto este robots.txt la noticia si tendría sentido.

Me asombra la cantidad de meneos de esta mier..noticia

bewog

#23 ¿Has leido la noticia? biene bastante bien explicado como evitar el google bombing con el robots.txt, pero basicamente, si no dejas que google indexe la pagina objetivo del google bombing, nunca se mostrara en los resultados de busqueda.

jamenda

Si no quieren aparecer en google la mejor manera es que quiten la pagina y ya que están que se quiten ellos también

D

bien, haber si le ponen correctamente, todo el mundo sabe que el que no esta en google es una aguja en un pajar de porno.

D

#19 Ya que estoy tan equivocado, por favor explícame por qué fue Google y no la Casa Blanca la que desactivó la de "miserable failure" contra Bush.

http://googleblog.blogspot.com/2005/09/googlebombing-failure.html

http://searchengineland.com/070125-230048.php

Aquí la noticia en todo caso es que tardasen tanto en utilizar un fichero presente en cualquier sitio medio decente. Parece muy raro que no lo tuviesen antes en la SGAE, pero por otro lado lerdos lo son un rato largo. Que no exista en el servidor de la Casa Blanca es simplemente inconcebible.

Por si aca:

There's also issues with robots.txt. The robots.txt file isn't for privacy, it's just an advisory to have search-spiders work more efficiently (think of how ill-considered it would be, to have a public file listing material which should not be viewed - "Do Not Look Here"). If the site doesn't want spidering, but many people link to it with certain words, it seems a reasonable thing to return that site for those words. The option of not returning the site isn't necessarily right, because sites often just use robots.txt to avoid the load of being spidered, rather than to hide in any way.

http://sethf.com/infothought/blog/archives/000568.html

j

Me parece muy bien que quien haya enviado la noticia crea que los de la SGAE son unos ladrones, pero me parece caer bastante bajo que la noticia se titule "los ladrones de la SGAE". Es una pena, porque quita autoridad al sitio meneame.net, y no me gustaría que fuese verdad esos que dicen que meneame es un patio de porteras.

Aitortxu

#12 lol lol lol

D

#19 Iba a poner robots.txt en negrita... oh wait! la URL es: http://www.sgae.es/robots.txt

demetzell

Pero realmente da igual, es página espejo. el robot le dirá que no siga la ruta de home a ladrones. No al reves...

Verlier

#16 Pos si, uno pensaría que es "Robo" más que Robot con la Sgae lol

T

Es un google bombing, por tanto no depende del contenido del sitio www.sgae.es

D

El google bombing no se evita con un fichero robots.txt.

D

#14 Estás equivocado. Claro que se evita el bombing con el robot.txt

#16 La dirección es: http://www.sgae.es/*robots.txt*

D

Venga tontos...