Este artículo tiene ya algún tiempo pero me ha parecido interesante traducir esta entrevista. Sobre todo la parte referente a la herramienta de extracción de texto.

Como todos sabéis, usar Flash para toda la página siempre ha sido un gran problema para la optimización de los motores de búsqueda. Simplemente no hay contenido para los motores de búsqueda que puedan indexar.

Así que cuando me enteré de que Google podía indexar el contenido de los archivos Flash, me sorprendió. Al parecer, este notable descubrimiento ha pasado casi inadvertido en la comunidad SEO.

Sin embargo, como probablemente ya sabes, Google siempre ha sido pionero en indexar contenido de diferentes formatos: Archivos PDF, .DOC, etc. Google también ha hecho muchos avances para indexar el contenido dinámico.

Y ahora es el primer motor de búsqueda en indexar Flash, otro paso adelante en la industria SEO.

Entonces, ¿por qué Flash presentó estos problemas en el pasado?

Antecedentes de Flash y SEO

Con una pagina principal en Flash surge el problema de decirle al buscador de que trata la página. Sin este texto, los motores de búsqueda no tienen nada que indexar. Por lo tanto, la página principal rara vez está bien posicionada, a menos que factores externos a la página como enlaces entrantes la hagan más popular.

En el pasado, se han hecho pocas pruebas y dispersas para solucionar esta dificultad. Esto puso las cosas muy difíciles a las empresas que querían mostrar una rica experiencia de usuario con una página en Flash, como las empresas de diseño gráfico, estudios fotográficos, empresas de diseño de páginas web, etc.

Asi, estas empresas a menudo sacrificaban el ranking por la experiencia de usuario, ya que rara vez se puede tener tanto tiempo para seguir todas las directrices que requieren los motores de búsqueda.

Entrevista a Michael Marshall

Cuando me enteré de que google indexaba flash por Michael Marshall, creador de ThemeMaster y moderador de nuestros cursos de marketing de motores de búsqueda, y de los fascinantes descubrimientos que había hecho, inmediatamente quería una entrevista con él.

Así que echemos un vistazo a lo que Michael ha descubierto acerca de Google y Flash.

Pregunta: Michael, ¿cómo sabemos que Google ahora indexa Flash? ¿Hay alguna manera de buscar archivos Flash indexados?

Michael Marshall: Si, Puedes introducir el término de búsqueda en Google, y usando el operador filetype puedes restringir la búsqueda a un archivo “.swf”. Esta operación sólo busca contenido en archivos Flash. Deberías ver [FLASH] justo antes de cada item de la página de resultados.

Por ejemplo, escribe lo siguiente en el cuadro de búsqueda en Google:

“Abra su negocio al mundo” filetype:swf

Cómo podemos extraer el texto de un Flash para saber que es lo que Google ve?

Macromedia tiene un Flash Search Engine SDK (http://www.macromedia.com/software/flash/download/search_engine/) que justo nos da lo que necesitamos. El SDK (Software Development Kit) incluye una aplicación que se llama “swf2html”. Swf2html extrae textos y enlaces de un .swf y devuelve los datos a la salida de pantalla o a un archivo HTML. Swf2html nos viene como una aplicación ejecutable y como una biblioteca estática para implementaciones. Para completar la funcionalidad, consulta el archivo Readme.htm incluido en el kit SDK.

¿Tienes un ejemplo de un archivo Flash que se pueda ver, así como un ejemplo de que texto se ha extraído de él?

Sí. Tengo un ejemplo de cada uno. El flash no es nada del otro mundo pero será útil para nuestro propósito. Visita la aplicación Flash y observa los textos que aparecen en él, y luego los que se han extraído en el HTML.

(Nota: Este ejemplo de Flash está basado en uno de los productos de Michael. Sin embargo, lo he elegido por 2 razones.

  • Porque hay muchos tipos de películas dentro de él.
  • Porque se trata de un ejemplo con mucho texto, a diferencia de otros muchos ejemplos en Flash que podría haber optado por usar.)

En el fichero de salida puedes ver que hay algún texto repetido varias veces y una parte de él incluso aparece “invisible” ya que el color de fuente es blanco. Esto solo es un efecto de la conversión, no es realmente texto invisible o para hacer spam.

En otras palabras, no estás haciendo nada malo, se debe simplemente a la herramienta y no a spam o texto invisible.

Pero cómo lo hacemos, ¿sabemos la forma en la que Google lo vé?

Una simple prueba nos mostrará que texto extrae Google de la presentación Flash. Puedes ir haciendo búsquedas en google con las palabras que tienes en el flash y ver los resultados que muestra. Cogiendo palabras o frases del principio del html que extrae la herramienta o del medio.

¿Cuanto de tu película ve Google? En otras palabras, cuanto profundiza Google dentro del flash.

Mi experiencia con esta herramienta me dice que google indexa todo el texto que muestra dicha utilidad, enlaces incluidos.

Has mencionado que, cuando ciertos tipos de movimientos en una película flash se asocian con textos, el resultado extraído contiene texto duplicado.

Los técnicos que nos leen saben lo que significa, pero para los que no lo son (como yo), ¿eso significa que tenemos que tener cuidado acerca de la utilización de ciertos tipos de animación, ya que estos podrían dar lugar a contenido duplicado, por lo tanto la posibilidad de crear Spam?

Sí. El tipo de animación que se aplica a un texto puede influir en la forma en que se extrae el texto. Si no quieres que haya una densidad de palabras clave o de contenido duplicado en lo que lee Google, tienes que cuidar el tipo de animación asociado a un texto.

Al ver el código fuente HTML que ha extraído la herramienta, no hay una etiqueta de Título. ¿Que parte del texto coge Google para poner en la etiqueta de título?

En mi experiencia, he encontrado que la primera línea de texto de la salida se usa como la etiqueta de título. Puedes usar swf2html y cambiar cosas en el flash hasta que tengas el resultado deseado. Además, la descripción en los resultados de búsqueda se crea dinámicamente (dependiendo de la consulta del usuario) de partes del texto extraído por Google.

¿Tienes otras sugerencias para la optimización de archivos Flash?

Sí. Yo recomendaría que la gente lea mi tutorial más técnico para obtener mas información acerca de la optimización de archivos flash (ver abajo)

Una cosa que quiero añadir es el problema que puede surgir en las presentaciones Flash que usen contenidos dinámicos extraidos de una base de datos, archivos xml, etc basados en entradas del usuario. Este contenido no es parte del propio archivo xml, por lo tanto, no será indexable por Google.

¿Qué hay de los banners en Flash? ¿Google también indexa el contenido de los banners en Flash?

Si. Cualquier presentación en Flash, si es toda la página o sólo un banner. He encontrado muchos casos de ambos.

Para instrucciones más técnicas SEO

Michael ha creado una página con una explicación más técnica de muchos de estos conceptos, en la siguiente URL.

La página también incluye el código fuente HTML de la producción extraída de su presentación Flash.

Http://www.internet-marketing-analysts.com/Google-Flash_tutorial/

(libre traducción de searchengineworkshops.com)