AMIGABLE PARA GOOGLE

aMIGO DE GOOGLEAunque Google tenga una gran capacidad para indexar webs, tiene también sus limitaciones, así que es conveniente conocerlas antes de empezar a construir tu web para hacerla ‘amigable’ a los robots que indexarán tus páginas. Hay ciertos elementos que pueden dejarte fuera del juego; otros no serán obstáculos insalvables, pero correrán en tu contra.

Las frames

Mucha gente tiene la creencia errónea que Google no puede indexar una página hecha con frames. Esto es falso: Google indexa perfectamente bien los sitios que usan frames. Tal como dice aparece en la propia web de Google:

¿Qué tipo de enlaces sigue el robot de Google?El robot de Google sigue los enlaces HREF y SRC.

Sin embargo, pueden suponer un problema ya que, si usas frames, la página principal de tu web será un breve archivo en el que dispongas las frames. Estos archivos presentan pocos elementos optimizables: el título, y poca cosa más. Para posicionarlos, dependerás casi totalmente de los links externos. Hay muchas páginas que se han posicionado muy bien a pesar de usar frames, pero ¿qué sentido tiene empezar a construir tu web poniendo palos en tus propias ruedas?

Si sigues empeñados en usarlas, podrás minimizar sus efectos negativos gracias a la etiqueta <noframes>. La función original de esta etiqueta consistía en introducir un texto destinado a aquellos navegadores que no podían visualizar correctamente los sitios con frames (ya sabes: “Tu navegador no soporta frames. Cámbiatelo ya, so carrozón.”). Actualmente, se usa principalmente para ofrecer algún contenido de sustancia a los robots de los buscadores: por ejemplo, una explicación de la web (lo que pondrías en tu página principal) y los links a las páginas interiores más importantes.

Otro problema de las frames es que a menudo los buscadores devuelven en sus resultados las páginas interiores, es decir, los frames de contenido, y el usuario no dispone de los mismos elementos de navegación que si hubiera entrado por la página principal. Es aconsejable introducir alguna función de javascript que fuerce la carga de los frames de navegación para estas ocasiones.

Flash

Una de las tecnologías más en boga en Internet son los archivos de Macromedia Flash. Realmente, las webs que los usan bien son muy vistosos y consiguen cosas imposibles de hacer en HTML puro.

Pues lo siento, chicos, pero hay malas noticias: los archivos Flash pueden representar el beso de la muerte para el posicionamiento de tu web. Google no puede leer los archivos Flash, aunque sí puede seguir algunos enlaces que encuentre dentro. Hay otros buscadores (como Alltheweb) que pueden extraer algunos contenidos, pero aun así la optimización que se puede lograr en ellos es muy limitada.

Vamos a repasar los usos más extendidos del Flash y los problemas que pueden traer:

  • Las splash screens provocarán el mismo problema que las frames: la página principal de tu sitio tendrá poco material optimizable. Como en las frames, se puede usar una etiqueta para los navegadores que no soporten o no tengan instalado el lector de archivos Flash y, de paso, para ofrecer algún contenido a los buscadores: <noembed>. Aunque Google pueda encontrar links dentro del archivo Flash, es conveniente que la opción ‘Saltar animación’ (no serás tan cafre como para no ponerla, ¿no? Aunque te parezca increíble, te aseguro que no todos queremos ver tu estupenda animación de dos minutos cada vez que entramos en tu web) no esté dentro del Flash sino que sea un simple enlace HTML.
  • Si haces todo tu sitio en Flash, tendrás muy pocos elementos para jugar con la optimización; dejando de lado el título y la etiqueta <noembed>, dependerás totalmente de los links externos. Es muy aconsejable que hagas una doble versión Flash/HTML.
  • Si tienes barras de navegación en Flash, cúrate en salud y utiliza también la etiqueta <noembed> para añadir los links o, aún mejor, añade los links en los pies de página.

Javascript

Google no interpreta javascript; por tanto no seguirá las ventanas pop-ups que se abran con este sistema, ni muchas de las barras de navegación dinámicas que también se basan en javascript. Puedes introducir los links en la etiqueta <noscript>, similar a <noembed> y <noframes>.

Sitios con gestión dinámica de contenido

Si quieres diseñar un sitio con gran cantidad de contenido que se renueve a menudo, artículos, comentarios a los artículos, foros públicos, etc., seguramente usarás una base de datos en combinación con algún lenguaje de creación de sitios dinámicos, como ASP, PHP o Coldfusion.

Los buscadores tenían muchos problemas a la hora de explorar estos sitios, y algunos ni siquiera han conseguido solventar este problema hasta hoy. Google puede explorar sitios dinámicos, pero tiene ciertas limitaciones; por ejemplo, raramente llegará a una página en cuya URL haya más de dos variables.

Hay maneras de hacer que las URLs sean más amigables para los buscadores: por ejemplo, los sistemas basados en Apache y PHP pueden usar el módulo mod_rewrite para que los buscadores traten las URLs dinámicas como si fueran estáticas. Es conveniente que antes de programar tu sitio averigües si puedes aplicar una de estas soluciones dependiendo de tus condicionantes (lenguaje escogido, acceso a la configuración del hosting, capacidad de éste, etc.). Puedes obtener esta información en alguna comunidad de usuarios de ese lenguaje concreto a través de foros, listas de distribución, grupos de noticias, etc.

Sin embargo, hay que tener en cuenta que, incluso con estas soluciones, un buscador sólo explorará los enlaces que realmente encuentre en la web; lo que no hará en ningún caso es rellenar un formulario para acceder a una sección, etc.

Pero entonces, ¿qué diablos le gusta a Google?

Apuesto a que a estas alturas estás desesperado, una vez descartadas todas las tecnologías que tenías planeado usar en tu web, y te haces esta pregunta: ¿qué le gusta a Google?

  • Ante todo, enlaces normales: ni javascript, ni redirecciones, ni menús pull-downs. Además, no hay que superar los 100 links por página.
  • Ficheros de tamaño no superior a 100 kilobytes; todo el código del archivo HTML que supere este límite será desestimado por Google.
  • También es conveniente que el equilibrio entre contenido (lo que verá el usuario) y código se incline hacia el primero; por tanto, es buena idea poner el código javascript y las hojas de estilo en archivos externos.
  • Una buena manera de asegurar la navegabilidad en tu página (especialmente si tienes muchas jerarquías o es un sitio dinámico) es incluir un mapa del sitio donde poner los enlaces internos más importantes.

Ponte en la piel de Googlebot

Un buen método de asegurarte de que el robot que envía Google a indexar tu página verá todo lo que tú quieres que vea es usar un simulador de robot de buscador. Estas utilidades leen los ficheros HTML tal como lo haría un robot (sin interpretar las imágenes, ni el código javascript, etc.) y muestran los resultados que serán relevantes para el robot: texto, encabezados, links.

Por supuesto, ninguno de estos simuladores es realmente el robot de Google, y hay un margen de error en su interpretación de lo que valorará éste, pero son útiles para hacernos una idea. Algunos de estos simuladores son:

 

Leave a Reply

Your email address will not be published. Required fields are marked *