A raíz de la reestructuración de la página de nerv me di cuenta de que Google había indexado los textos de unos SWF que tenía en una sección y sin embargo otros no. Me refiero a los 3 archivos Flash que hay en Portada y a los otros 3 dentro de la sección de Diseño Web y Servicios. Estuve un tiempo buscando la razón de porque había indexado los textos de los 3 últimos SWF y no los de portada, si eran casi identicos. Hasta que caí que los interiores estaban exportados como Flash versión 7 y los nuevos de portada en la versión 8, que por lo visto Google aún no puede leer por alguna razón que desconozco.

Eso por una parte, más tarde me encontré con una herramienta para extraer un HTML del SWF, y sacar los textos que pueden ser indexables. La herramienta se llama swf2HTML, es un poco fea porque tienes que ejecutarla desde la línea de comandos ( en la opción Ejecutar.. en el menu inicio, escribe “cmd”, sin comillas ), pero funciona bien. La sintaxis básica para que te muestre los textos que puede sacar de tu SWF es la siguiente:

C:\swf2html tuarchivoflash.swf

Si es que teneis el ejecutable swf2html.exe en el disco C: y el SWF en la misma ruta. De todas maneras dentro de la carpeta tenéis instrucciones con la sintaxis de uso.

Haciendo pruebas con esta herramienta pude verificar que no extraía ningún texto de los SWF de portada y sí de los de la sección interior.

Podéis leer algo más en la entrevista a Michael Marshall.