Guía Screaming Frog
Esta es una guía completa para configurar Screaming Frog y conocer todo lo que te permite esta herramienta.
Si quieres mejorar cualquier aspecto SEO de una web, esta guía será tu amiga.
Empecemos →

Introducción a Screaming Frog
¿Qué es Screaming Frog y para qué sirve?
Screaming Frog es una herramienta que permite rastrear sitios web de cualquier tamaño, siendo capaz de detectar y extraer una gran cantidad de información que tendrás disponible para poder analizar y tomar las decisiones que mejoren el SEO de tu sitio.
Se trata de una de las herramientas más utilizadas por cualquier SEO debido a todas las ventajas y opciones que te permite realizar. Screaming es una de las herramientas más completas a nivel SEO que te permitirá, en muchos casos, extraer toda la información que necesites sin necesidad de acudir a otras herramientas.
¿Cómo funciona Screaming Frog?
Al rastrear un sitio con Screaming Frog podrás ver lo que los crawlers de Google encontrarán cuándo rastreen tu sitio, te facilitará encontrar errores de forma rápida, ver oportunidades de mejora y una gran cantidad más de opciones.
Screaming te aportará datos tan simples como conocer la longitud de un title en tu web, como información mucho más avanzada, por ejemplo: buscar todas las páginas que contengan «x» keyword en su texto.
Principales usos de Screaming Frog para SEO
Esta herramienta de crawling principalmente es utilizada por los consultores SEO cuando se lleva a cabo una auditoría del sitio web, conociendo los principales errores que afectan al posicionamiento como:
- Enlaces rotos 404.
- Analizar metadatos.
- Imágenes.
- Canonicals.
- Etc.
Aunque como verás en esta guía, con el potencial que tiene esta herramienta, se le pueden aplicar usos infinitos y hacer uso de ella para rastrear casi cualquier información que se encuentre en el código fuente de la web.
Panel y configuración
Panel
Para empezar a entender la herramienta haremos un pequeño recorrido por el panel, para ver donde deberás buscar cada dato posteriormente:

- En la barra superior, se encuentran todos los menús desplegables desde donde configurar como y que información se quiere buscar, guardar rastreos, exportar y cargar datos o programar rastreos.
- Una vez cargada la información, desde las pestañas de abajo y la columna de la derecha, se puede seleccionar que información se está buscando.
- Una vez selecciones la información que deseas ver, en la pantalla central de arriba, se mostrarán todas las urls con esa información y si haces clic en una de ellas, en la pantalla inferior te mostrará datos sobre esa dirección en concreto.
Esta sería una vista muy simple del panel, aunque quedan muchas cosas por comentar. Por el momento, no profundizaremos más en este apartado, ya que durante esta guía iremos comentando todo.
Y una vez hayas leído esta guía, comprenderás esta herramienta por completo.
Configuración
Un error muy común al empezar a utilizar esta herramienta al principio, es no configurar el rastreo.
Esto tiene el problema de que si no se ajustan los datos antes de realizar la búsqueda, puede que dejes datos sin rastrear o rastrees más de los que se necesitas, perdiendo más tiempo del necesario y complicándote más para encontrar los datos, ya que tendrás que filtrar entre más información.
¿Cómo configurar Screaming Frog?
Configuración de Spider
Desde la barra superior → desplegas el menú de la pestaña de configuración y haciendo clic en Spider, te mostrará una ventana con las opciones de configuración de spider.
La configuración de Spider, es el principal lugar de configuración desde donde te permite indicar que datos rastrear y cuáles dejar fuera.
Hagamos un recorrido por este panel:
Rastreo
En la primera pestaña, rastreo, se encuentran diferentes datos para incluir o excluir. Deberás echarle un ojo antes de tu rastreo y ver cuales te interesa que se encuentren seleccionados.

La mayoría de datos serán bastante intuitivos de reconocer si te van a ser útiles o no.
Al marcar la casilla de «rastreo», spider rastreará las direcciones para verificar su código de respuesta y al marcar la casilla de «almacenar», almacenará y mostrará los datos de esas urls.
Por ejemplo, si solo quieres saber que código de estado devuelven algunas páginas, bastará con rastrear.
Si además, quieres conocer, en caso de que el código de respuesta sea un 301, ver donde se encuentra ese enlace interno, deberá estar seleccionada también la casilla de «almacenar».
Algunas anotaciones sobre este apartado:
- Si desmarcas la casilla de imágenes, se excluirán los elementos (img src) pero las imágenes vinculadas se seguirán rastreando. Si deseas excluir las imágenes vinculadas, deberás realizarlo de otra forma, como por ejemplo, utilizando el apartado «excluir» que veremos más adelante.
- Rastrear todos los subdominios. Al marcar esta casilla, screaming, cuándo encuentre un subdominio a través de un enlace interno, seguirá rastreándolo y lo tomará como parte del sitio, de lo contrario, simplemente tomará este como un enlace externo.
- Sitemaps XML. Si marcar la casilla de rastrear sitemaps, tendrás la opción de que el mapa sea descubierto a través del robots.txt si lo tienes implementado. También puedes añadir en el recuadro de abajo el sitemap que desees rastrear.

Extracción
En esta segunda pestaña, se encuentran datos que puedes descartar o incluir para que se almacenen y muestren, en relación a las urls y archivos que anteriormente has decidido rastrear.

Algunas anotaciones sobre el apartado de extracción:
- En detalles de URL → tiempo de respuesta: indica el tiempo en segundos que el spider ha tardado en rastrear esa dirección. Puede ser una información interesante para conocer como de rápido, están respondiendo tus páginas.
Algo que te mostrará de forma gráfica, en la columna de la derecha:

- Para analizar los datos estructurados, debes seleccionar las casillas de datos estructurados, que por defecto vienen desactivadas.
Límites
En la pestaña de límites podrás limitar la cantidad de urls que se rastrean:

- Esta configuración te permite limitar la cantidad de direcciones a rastrear:
- Limitando el rastreo total.
- Limitar el nivel de profundidad, es decir, a cuántos clics de distancia.
- Limitar las URLs por nivel de profundidad. Número de urls que se rastrean en cada nivel de profundidad.
- Limitar por carpetas, por ejemplo www.midominio.com/blog sería una carpeta nivel 1, y www.midominio/blog/artículos/ sería nivel 2, pero www.midominio.com/blog/#busqueda sigue siendo nivel 1.
- Limitar el nº de cadenas de consulta es una opción por si te conviene limitar por el número de parámetros tipo (?x=) que se generan, por ejemplo: midominio.com/pantalones?p=rojos_?g=hombre, tiene 2 parámetros.
- Y también permite limitar por la longitud de las urls o tamaño de la página en KB. y limitar por ruta de URL.
- Para las redirecciones, tienes la opción de máximas redirecciones a seguir.
- Y tienes la opción de limitar la cantidad de enlaces que rastrear por página, en «máximo de enlaces que rastrear en cada url«.
Cuándo se selecciona una de las opciones para establecer un límite, spider cuenta a partir de la parte del sitio que has situado como inicio.
Poniendo como ejemplo que estás limitando por profundidad, en este caso, si escribes la home: midominio.com, este será el clic 0, o si empiezas a rastrear por un post: midominio.com/articulo-1 también contaría como clic 0.
Ejemplo de limitación de rastreos: ¿Cómo limitar rastreos por directorios?
Limitar un rastreo por subdirectorios hará que se limite el rastreo a las urls que se encuentran a partir de esa subcarpeta.
Por ejemplo, si incluye la url https://jamilmansilla.com/blog/ , solo se rastrear todas las urls que se encuentren a partir de /blog/.
Para limitar el rastreo por directorios simplemente incluye la dirección url por la que quieres comenzar el rastreo en la barra superior.

Y desmarca la casilla “Rastrear fuera de la carpeta de inicio”, que se encuentra en Configuración > Spider > Rastrear.
De lo contrario también rastreará los enlaces internos que se vinculan desde este subdirectorio aunque no se encuentren dentro de él.
Renderizado
En este apartado seleccionas la opción del renderizado del código. Si dejas configurada la opción que viene por defecto solo texto, se renderizará el código HTML puro.
Si configuras la opción javaScript ejecutará este código y te mostrará una captura de como se está viendo.

Al seleccionar la opción de JavaScript, tendrás más opciones para configurar el renderizado de este código JavaScript. Esta opción lógicamente será la que más recursos le cueste a screaming, por lo que llevará más tiempo el rastreo.
Avanzado
La pestaña avanzado, ofrece más opciones de configuración para tratar la información que vamos a recopilar en el rastreo.

Pasamos a comentar los puntos más importantes de este apartado que debes conocer:
- La opción seguir siempre redirecciones, seguirá un código 3xx hasta su url final, independientemente de que hayas limitado la profundidad de rastreo.
Esto es especialmente útil si has hecho una migración, ya que se pueden crear cadenas de redireccionamientos.
- Al marcar seguir siempre canonicals, ejecutará que en el modo lista siga los canonicals hasta la URL de destino de redireccionamiento final, ignorando el límite profundidad de rastreo también.
Esto sucede, cuando se crean cadenas de canonicals, donde una url, que tiene un canonical que a su vez tiene otro canonical.
- Seleccionar «respetar noindex, canonicals y rel next/prev« servirán para limitar la información que se muestre en screaming. En este caso, se seguirán rastreando los enlaces que se encuentren en su contenido, pero no te mostrarán estas urls.
- Al marcar «respetar noindex« no aparecerán la urls con la etiqueta noindex.
- «Respetar canonicals«, no mostrará las urls con un canonical que no apunte a sí mismas.
- Y al marcar la casilla: «respetar rel next prev«, solo mostrará la primera url de la secuencia de paginaciones.
- La opción «extraer imágenes del atributo srcset«, en el caso de que se cuente con imágenes con este atributo, algo poco común, pero de ser el caso, al marcar esta casilla, screaming te las mostrará.
- «Rastrear identificadores de fragmento» hace que una dirección con fragmentos hash, es decir, urls que ves de esta forma: https://jamilmansilla.com/vocabulario-seo/#seo, se traten como páginas independientes.
- Por último, «tiempo de respuesta», el tiempo máximo que el spider dedicará a rastrear cada dirección, de no conseguirse en este tiempo, devolverá un código de respuesta 0.
Y «reintentos de respuesta 5xx», como el nombre indica, será el nº de veces que screaming intenta rastrear una dirección a la que el servidor no está respondiendo.
Preferencias
La última pestaña de configuración de spider, viene más relacionada con los aspectos básicos del seo on page, permitiendo que modifiques los caracteres de los atributos que screaming trae por defecto a la hora de indicártelos como «optimizables», y configurar el apartado de enlaces.

Robots.txt
Una vez, finalizado el apartado de spider el cual es el más importante entender y configurar, continuamos en la pestaña de configuración > Robots.txt.
Configurar robots.txt
En la configuración de robots, tienes varias opciones:

- Respetar el robots.txt. En este caso, al igual que si se tratase de un bot de Google, screaming no crawlea las urls bloqueadas.
- Ignorar el robots.txt. Con esta configuración, omite la información del robots y crawlea todos los enlaces que se encuentre.
- Ignorar el robots.txt pero informar de su estado. Esta opción significa que accederá a rastrear todas las urls, estén bloqueadas o no, pero te indicará si se encuentran bloqueadas en el robots.txt.
Robots.txt personalizado
En el apartado de configuración → Robots.txt → Personalizado, la herramienta te permite añadir el archivo robots de tu sitio y modificarlo para poder hacer pruebas sin necesidad de tener que modificar el archivo original.
Incluir y excluir
Los apartados de configuración «Incluir y Excluir» son una de las configuraciones más útiles de la herramienta screaming.
Sobre todo, cuando rastrees sitios grandes, con esta opción podrás restringir el crawleo solo a la parte del sitio que te interesa, por ejemplo, en una web multi idioma, puede que te interese rastrear solo las urls que hagan referencia al inglés.

En los apartados incluir y excluir, podrás segmentar tu rastreo, incluyendo que solo se rastree una parte del sitio o excluyendo parte del sitio o combinando ambas. Deberás indicar esta condición mediante expresiones regulares.
Por ejemplo, si deseas excluir todas las imágenes, como vimos en la configuración de spider, las imágenes vinculadas, no se podían excluir desde esa sección, pero añadiendo en el apartado excluir, las expresiones: .*jpg$ .png$ .*gif$, las excluiría.
Lo que si debes saber es que, al excluir una url, el spider no la rastrea, por lo tanto, tampoco rastreará los enlaces internos que contenga, aunque estos no estén excluidos.
Y también puede que rastrear parte de un sitio, a partir de la función incluir, por ejemplo: www.midominio.con/es, no llegue a rastrear todas las urls, en comparación con rastrear el sitio entero y filtrar solo las /es, ya que de esta forma puede que se encuentre con algunos enlaces más.
Pero aun así, esta parte de configuración es extremadamente útil y necesaria en algunos casos y en otros te ayudará mucho a filtrar el rastreo y sacar información de una forma más clara.
¿Cómo limitar el rastreo con la función Incluir y excluir de Screaming Frog?
- Limitar rastreo con la función incluir
La función incluir, que se encuentra dentro del apartado de configuración se puede utilizar para limitar el rastreo a través del uso de expresiones regulares.
En este caso, vamos a explicar como limitar el rastreo, cuándo quieras seleccionar las url que contienen un cierto término en su dirección url.
Por ejemplo, supongamos que quiero extraer todas las urls que contienen “seo” y “screaming” en la url.
Para hacer esto, acude a la sección de “Incluir” y añade las consultas: “seo|screaming”.
Y la segunda acción a realizar es incluir la dirección web a rastrear, es importante, que el rastreo se inicie desde una url donde se encuentran vinculadas las páginas que desees rastreas.
En mi caso, seleccioné el blog.
Y el resultado será que screaming nos devuelve todas las páginas que contienen estas consultas en su dirección url.

Esto es algo muy útil para tratar con ecommerce y filtrar por x tipo de producto.
- Limitar rastreo con la función incluir
La función excluir de screaming frog permitirá excluir aquellas partes del sitio que son irrelevantes.
Podemos hacer uso de esta función, configurándose de la misma forma que la función incluir, pero con el objetivo de excluir aquellas partes del sitio que no nos interesan.
Velocidad
El apartado de configuración de velocidad sirve para ajustar la rapidez con la que screaming rastrea el sitio, donde:
- Max. Hilos/s: es el número de arañas que rastrean por segundo.
- Max. URLS: es el número de urls que se rastrean por segundo.

¿Cuándo es conveniente modificar esto? La respuesta es cuando recibimos señales de que el servidor se está sobrecargando (por ejemplo muchos errores 500 o 403). En este caso, puedes limitar el número de urls que se rastrean por segundo.
User – Agent
Esta función permite elegir el agente de usuario que rastreará el sitio web. Screaming, por defecto, cuenta con su propio user – agent y es el que viene establecido por defecto, pero permite más opciones.
En ocasiones puede que te encuentres con que se encuentre denegado el acceso al bot de screaming, en este caso, puedes probar cambiar el user – agent.
Si accedes a Search Console > Ajustes > Estadísticas de rastreo, te informará de que bot está visitando más tu sitio, en la mayoría de casos será Googlebot para smartphone.

Puede ser interesante seleccionar este, de esta forma tendrás un rastreo más parecido al que está realizando Google.
Enlaces personalizados
Screaming te muestra la posición donde se encuentra un elemento (menú, footer, sidebar…) Esto es muy útil para identificar un enlace más fácilmente.
O para analizar el enlazado interno, ya que te interesa saber si una página tiene muchos enlaces internos porque se encuentra en el menú o si son enlaces con texto ancla.
Esto lo puedes ver en Configuración > Personalizado > Posición de enlaces.

Para identificar esto, screaming interpreta los elementos HTML5 del sitio, pero cada web está construida de forma diferente y puede que el spider no llegué a reconocerlos de forma adecuada o que desees personalizar la ubicación de los enlaces.
Vamos con un ejemplo:

Esta web, cuenta con un sidebar lateral para todas las páginas de servicios, y los enlaces que se encuentran en ellas, por defecto, se muestran dentro del contenido.
En este caso, para tener un mejor control del enlazado interno, deseamos ubicarlos, ya que es algo repetitivo para todas estas páginas.

En la ruta del enlace que nos está dando screaming, copiamos el id ‘text-60’, que identifica todos los enlaces que parten de este sidebar (también puedes copiar otra parte de la ruta del enlace que haga referencia a todos los enlaces que se relacionan con ese elemento).

Vamos al apartado de configuración de posición de enlaces y añadimos una nueva línea.
Es importante saber que la clasificación de estos enlaces sigue un orden de procedencia y dado que «contenido» tiene establecido ‘/’, coincide con cualquier ruta de enlace, por lo que debe dejarse siempre en la parte inferior.

Al volver a realizar la búsqueda, ya encontramos que los enlaces se marcan en la ubicación que hemos configurado.
Al igual que es interesante configurar la posición de enlaces, puede que en otros casos, no te interese saber esta información y ante un rastreo muy grande, puedes desactivar esta información desde la casilla superior del panel, de esta forma se ahorra memoria y ayudará en acelerar el rastreo.
Almacenamiento
En Configuración → Sistema → Modo de Almacenamiento puedes modificar el tipo de almacenamiento que screaming está empleando.

Screaming frog tiene dos opciones de almacenamiento:
- De memoria. Este modo utiliza la memoria RAM para almacenar y procesar datos, es la que viene por defecto y la que más rápido rastrea.
- En base de datos. En este caso, la información y rastreos pasan a almacenarse en la base de datos. Utilizar esta configuración principalmente será conveniente para rastrear sitios muy grandes, a partir de 500k urls.
Utilizar el almacenamiento en base de datos, aunque no estés rastreando sitios muy grandes, puede ser necesario si deseas hacer uso de las funciones de comparación de rastreo y detección de cambios, ya que solo están disponibles en este modo.
Y ofrece la ventaja de poder recuperar rastreos, si lo detienes, cierras o borras sin querer. Los rastreos se guardan automáticamente y se pueden volver abrir a través de Archivo > Rastreos.
Sí deseas utilizar este modo, será conveniente utilizar una memoria SSD para evitar sobrecargar la de tu ordenador.
Funciones de Screaming Frog
Modo
Entender y dominar los diferentes modos de crawleo de screaming te permitirán controlar el SEO de una web de forma muy óptima.
El modo spider es el más utilizado, analiza como una araña de Google desde la url que le indiques y estarás ya familiarizado con él.
El modo SERPs simplemente te permite cargar metadatos, para comprobar si son óptimos y comprobar como se visualizarían en Google.

Dicho esto, pasamos a comentar los otros dos modos:
Modo lista
Este modo te permite conocer información sobre un listado de urls en concreto. Para importar las direcciones puedes subir un archivo, copiar y pegar, incluir la dirección de un sitemap o escribirlas manualmente.
¿Para qué puede ser útil el modo lista?
Utilizar esta sección de la herramienta, es una forma rápida de obtener datos, cuándo sabes donde y qué estás buscando de forma concreta, algunos ejemplos valiosos:
- En una web comprobar que todas las urls del sitemap devuelven un código 200.
- Después de aplicar cambios en algunas páginas, comprobar que se han implementado con éxito.
- Analizar a la competencia, subiendo el listado de tus competidores y comparando ciertos datos, como su page rank con la API de Ahrefs.
Importante
Algo importante que debes saber, al utilizar esta función de la herramienta:
- Es necesario configurar el spider, ya que al seleccionar este modo, la configuración por defecto te limita el rastreo a un nivel de profundidad 0.
- Si subes las direcciones de páginas duplicadas no pasa nada, screaming eliminará los duplicados.
- Todas las urls deben comenzar por http o https, por ejemplo ‘www.dirección.com’, no la reconocería.
Modo comparar
La función de comparar rastreos es una joya para monitorizar como evolucionan el SEO de un sitio web.
Podrás conocer que datos han cambiado entre diferentes rastreos, y profundizar en ello, para saber lo que ha cambiado y por qué ha sucedido.
Conectar APIs
Screaming permite conectar diferentes APIs y extaer información para cada url de esas herramientas.
Actualmente esta herramienta permite conectarse con las APIs de:
- Google Analytics.
- Google Search Console.
- PageSpeed Insight.
- Ahrefs.
- Majestic.
- Moz.
Casos prácticos
Análisis de contenido con Screaming Frog
En esta caso, vamos a hacer uso de la herramienta para analizar qué páginas tienen un contenido pobre, cuáles tienen un contenido duplicado o muy similar y cómo están a nivel de ortografía y gramática nuestros contenidos. ¡Empecemos!
¿Cómo configurar Screaming Frog para analizar el contenido?
Configurar correctamente hará que rastreemos el contenido adecuado, ni más ni menos, y que se analice de la forma correcta.
Contenido > Área
Screaming rastrea y muestra la información de recuento de palabras por página, contenidos semi duplicados y revisiones ortográficas y gramaticales.

Cuándo vayas a visualizar estos datos, para evitar que no aparezca información repetitiva que afectaría a la hora de interpretar los datos de forma válida, screaming por defecto excluye el menú de navegación y footer.
Sin embargo, si en tu web, estos elementos no son HTML5, no los podrá interpretar y excluir. También es muy posible que te encuentres con otros elementos que te conviene excluir, como puede ser un sidebar.
En este este apartado de configuración, puedes incluir o excluir elementos HTML, clases o ID para que solo se muestre el contenido que te interesa.
También puedes marcar la casilla de arriba, para que el texto ALT de las imágenes se incluya dentro del contenido de la página.
Contenido > Duplicados
La herramienta te informa del contenido duplicado exacto y del contenido semi duplicado. Para este último tendrás que habilitarlo y configurarlo.
En el apartado anterior, excluimos y/o incluimos las partes de la página que te interesa que se tengan en cuenta dentro de este contenido semi duplicado.
Ahora pasamos a activar la casilla de «contenido semi duplicado«, al hacerlo, nos indicará el porcentaje a partir del cual te mostrará las direcciones que se encuentren como «contenido duplicado».

Screaming, por defecto, solo tiene en cuenta las páginas indexables, si quieres saber también la información de las urls no indexables, debererás desactivar la primera casilla.
Para conocer los datos, debes empezar el análisis de rastreo posterior.

Si posteriormente decides modificar este porcentaje o los elementos que anteriormente has decidido excluir/incluir, puedes volver a analizar el rastreo, sin necesidad de rastrear el sitio entero.
Contenido > Ortografía y gramática
Con esta herramienta tienes la posibilidad de revisar ortografía y gramática de páginas HTML. En «Contenido > Área», ya excluiste los elementos html, clases y ID que no te interesa que aparezcan dentro de este contenido a revisar, ahora pasamos a configurar este apartado.

Primero, debes activar las dos pestañas de revisión y más abajo tienes dos opciones:
- En automático, screaming interpretará las etiquetas html de idioma de tu sitio y de no encontrar ninguna, empleará el idioma configurado.
- La opción manual hará que el rastreador directamente base el análisis en el idioma que se indica abajo.
En la siguiente pestaña puedes configurar las reglas gramaticales que se empleen.
En ignorar puedes incluir un listado de palabras o frases que ignorar a la hora de llevarse a cabo la revisión de ese rastreo.
Y como última pestaña de configuración, en diccionario puedes incluir palabras o frases que ignorar en ese y en todos los rastreos, como puede ser tu nombre de marca o aquellos términos que ya sabes que no van a interpretarse correctamente y te interesa omitir.
Si posteriormente decides modificar esta configuración, sin necesidad de volver a rastrear el sitio entero, puedes actualizar la información de las urls aquí:

Analizando el contenido
Una vez has realizado la configuración, vamos a ver que datos sacamos de esta herramienta para mejorar el contenido de tu web:
Contenido duplicado
Primero, podrás ver las páginas con contenido exacto en la pestaña duplicados exactos y en semi duplicados, te mostrará de cada url, el porcentaje de similitud con otras páginas y el nº de páginas en las que se encuentra semi duplicado el contenido.

En el menú inferior, la pestaña «detalles de duplicados» te mostrará de forma visual que textos de la página se encuentran duplicados.

Páginas con poco contenido
Desde la pestaña de contenido, puedes ver el recuento de palabras de cada página y en el apartado páginas con poco contenido, podrás ver todas las páginas que se consideran urls con poco contenido.
Por defecto, screaming considera poco contenido, aquellas páginas que cuentan con menos de 200 palabras, puedes modificar este nº de palabras en: configuración → spider → preferencias.
Ortografía y gramática
En las columnas del panel central podrás ver la cantidad total de errores que se encuentran en cada dirección, esto lo puedes relacionar con el recuento de palabras y tener una idea de las urls que deberías revisar primero.
La información más interesante de esta herramienta, una vez seleccionada la url en el menú superior, la pestaña detalles de la ortografía y gramática, te indicará información detallada de ese error y te aportará sugerencias.

Rastreos personalizados
Las opciones de realizar rastreos personalizados es una función increíblemente útil, podrás buscar y extraer casi cualquier dato que se encuentre dentro del código del sitio, si no conoces esta función, presta atención porque te será de ayuda:

Búsqueda personalizada
Con esta función screaming te permite encontrar lo que quieras de tu sitio web si se encuentra en el código fuente. La función personalizada buscará los elementos solicitados en el código HTML de cada página rastreada.
Dependerá de la configuración del modo de renderizado que busque en el código HTML estático o renderizado.
¿Cómo realizar una búsqueda personalizada?
Comentaremos las pestañas a rellenar de izquierda a derecha:

En el apartado de la izquierda, introduces el nombre con el que vas a identificar esa búsqueda.
En la siguiente pestaña, elige si te interesa ver las páginas que contienen ese elemento o las que no lo contienen.
Selecciona realizar la búsqueda utilizando texto o una expresión regular (screaming trabaja con la biblioteca de expresiones regulares de java).
Distinguir entre mayúsculas y minúsculas, al introducir texto: despliega la casilla y si quieres que busque la palabra o frase prestando atención a las mayúsculas seleccione la casilla, de lo contrario mostrará tanto mayúsculas como minúsculas.

Esto es muy útil para buscar por ejemplo el nombre de tu marca o producto y comprobar que está bien escrito en todas las páginas, por ejemplo, puedes comprobar que no exista ninguna página en la que comienza con minúscula.
En caso de utilizar expresiones regulares se indicaría con la regla: (?i) antes de la palabra.
Otras expresiones regulares útiles son:
- \bpalabra\b: para buscar palabras exactas
- Separar con contra barra (|), de esta forma sumará varias palabras. Por ejemplo: \bpalabra1\b|\palabra2\b mostrará la cantidad de veces que aparcen “palabra1” y “palabra2” en cada página de forma exacta.
Cuándo hagas uso de esta herramienta, tendrás en cabeza las expresiones que más uses y otras deberás revisarlas en la guía o consultar en Google en el momento de necesitarlas.
Y en la última casilla, elige donde se debe realizar la búsqueda. Tienes varias opciones, entre ellas, se encuentra área de contenido, esta es una sección que anteriormente en el apartado de configuración explicamos como configurarla para buscar solo el contenido que te interese.
Después, rastrea el sitio y podrás ver esta información en la barra superior o en el menú derecho.

Para el ejemplo de la imagen he buscado las páginas que contienen la palabra «planta» y me está mostrando la cantidad de veces que se repite esa palabra en cada url.
Puedes combinar varias búsquedas, como por ejemplo las páginas que contienen una keyword y no contienen otra keyword y comparar la búsqueda en el panel.
Como hemos visto, la búsqueda personalizada puede ser muy útil en algunos casos, pero como el nombre indica, solo busca, no extrae los datos, para esto pasamos al siguiente apartado.
Extracción personalizada
Esta función permite extraer cualquier dato que se encuentre en el código HTML de las urls que devuelven un código 200, a través de CSSParth, XPath y regex.
Dependerá de la configuración del modo de renderizado, que la búsqueda se ejecute sobre el código HTML estático o renderizado si seleccionas que represente el código JavaScript.
Algunos ejemplos de la función de extracción pueden ser:
- Ver los encabezados h3 de tus páginas.
- Mostrar el número de comentarios de cada post.
- Extraer todo el texto de las páginas.
- Etc.
¿Cómo usar la extracción personalizada de Screaming?
Para configurar la búsqueda. Accede a configuración > Personalizado > Extracción y llegarás a un panel como el siguiente:

- En la primera casilla de la izquierda, simplemente introduce cómo quieres que se nombre a tu solicitud de extracción.
- En el siguiente apartado selecciona a través de que se extraerá la información: XPath, Ruta CSS o expresión regular.
Dependiendo del elemento que quieras extraer te será más conveniente una opción u otra.
Puedes ver ejemplos de usos de XPath y regex.
XPath y Ruta CSS, permitirán seleccionar qué información extraer con los filtros:
- Extraer HTML interno. Extrae el contenido HTML interno del elemento seleccionado y de sus subelementos.
- Extraer elemento HTML. Extrae el elemento seleccionado y su contenido interno.
- Extraer texto. Extrae el texto del elemento seleccionado y de sus subelementos
- Valor de función. Devolverá el resultado de la función que indiquemos. Por ejemplo, conocer la cantidad de etiquetas h2 de cada página con la función contar (//h2).
Una vez configurado esto, y habiendo introducido el elemento o expresión regular, puedes aplicar esta búsqueda, rastreando un sitio o utilizando el modo lista.
Para entenderlo mejor, pasemos a ver un ejemplo:
Ejemplo: Conocer el porcentaje de descuento que aplica un competir a cada producto.
Imagina que esta es una web de tu competencia, y te interesa conocer que porcentaje de descuento está aplicando en cada producto.

¿Cómo averiguamos esto?
Situándonos en la página, para buscar en el código, presionamos botón derecho → inspeccionar y con ayuda del selector → marcados ese elemento y copiamos con XPath.

Después de esto, acudimos a Screaming y copiamos en el apartado de extracción la información que nos ha copiado el selector.

Ahora que ya lo tenemos configurado, rastreamos la página del competidor, acudimos a la pestaña de extracción y veremos los siguientes datos, que serán el resultado buscado.

Consejos para sacar el máximo partido a Screaming Frog
La mejor recomendación que te daremos es que antes de realizar un rastreo, te realices la pregunta: ¿Qué objetivos tengo y qué configuración necesito?
Respondiendo esta pregunta, ahorras tiempo, y segmentarás mejor la información.
Dicho esto, te dejamos algunos tips interesantes.
Tips
- Cuando encuentres datos que llevan la «i». Significa que debes analizar el rastreo para visualizarlo.

- Para tener una visión más clara de la información. Limpia la barra superior, elimina y ordena las columnas según tus preferencia y guarda esta configuración.
Además, al hacer clic derecho sobre una pestaña, Screaming te permite configurar las pestañas de cualquier sección.

Desmarca las casillas que no te interesen y para ordenar simplemente arrastra las columnas hacia donde te interese.
- Screaming + Excel. Screaming es excelente, pero si además saber combinarlo bien con Excel, podrás exprimir los datos al máximo. Además, si eres más fan de Google Sheets como yo, la herramienta te permite conectar con tu cuenta y exportar datos de forma muy práctica.
- Haz uso de Informes y exportación en bloque. Desde aquí, podrás exportar datos rápidamente, como por ejemplo en «Resumen SERPs«, reportar un informe de los metadatos de tus páginas.
- Screaming permite separar las ventanas, presionando clic derecho → Desasociar, para tratar la información de forma más práctica.
- Si por algún caso, has modificado las columnas y/o pestañas y deseas restablecer la configuración inicial. Puede hacerlo desde configuración > Interfaz de usuario.
- Es interesante que sepas que screaming te permite programar un crawleo.
Conclusión
Como habrás visto, Screaming Frog es increíblemente poderoso, realmente aplicando un uso completo de este, puedes tener el SEO de un sitio bien optimizado sin tener que acudir a otras herramientas.
Ahora te animo a probar lo que hemos explicado en esta guía, así te irás familiarizando y estarás más cerca de dominar screaming frog.
¿Tienes alguna duda o crees que deberíamos haber comentado algo más? → Déjanos un comentario.

Jamil Mansilla
Especialista SEO
Especialista en SEO y Marketing Digital. Apasionado de seguir aprendiendo y compartir mi conocimiento con artículos cómo este.