Cómo copiar URLs indexadas desde un resultado de búsqueda de Google
Seguramente les pasó muchas veces que necesitaban hacer un análisis de las páginas indexadas en Google de un sitio web para comparar con el listado de URLs que les envió un cliente. Una forma práctica de hacer esto es usando el snippet que desarrolló Chris Ainsworth de chrisains.com.
Básicamente consiste en agregar un código JavaScript en la barra de marcadores de tu navegador. Después de correr una query en Google (lo más probable es que sea un ‘site:dominio.com’), se cliquea el marcador y el script automáticamente parsea la data. Desde ahí se puede copiar y pegar directamente a un Excel para poder empezar a darle forma.
El script funciona mejor con el Ginfinity, una extensión para Google Chrome que permite concatenar páginas de resultados de búsqueda para verlas en una sóla página. Después haría falta configurar el resultado de búsqueda para que Google muestre de a 100 resultados por página. De esta forma, se levanta toda la información de los SERPs en unos pocos clicks. Tengan cuidado de no correr demasiadas queries a Google de forma automatizada ya que puede saltarles un captcha que les pida verificar que no sean un robot.
A continuación les dejamos el script. Si les parece útil, no se olviden de dejarle un comentario al desarrollador.
javascript:(function()%7Boutput%3D%27<html><head><title>SEO SERP Extraction Tool</title><style type%3D%5C%27text/css%5C%27>body,table%7Bfont-family:Tahoma,Verdana,Segoe,sans-serif%3Bfont-size:11px%3Bcolor:%23000%7Dh1,h2,th%7Bcolor:%23405850%7Dth%7Btext-align:left%7Dh2%7Bfont-size:11px%3Bmargin-bottom:3px%7D</style></head><body>%27%3Boutput%2B%3D%27<table><tbody><tr><td><a href%3D%5C%27http://www.chrisains.com%5C%27><img src%3D%5C%27http://www.chrisains.com/wp-content/uploads/2015/06/chrisains.com-logo1.png%5C%27></a></td><td><h1>SEO SERP Extraction Tool</h1></td></tr></tbody></table>%27%3BpageAnchors%3Ddocument.getElementsByTagName(%27a%27)%3BdivClasses%3Ddocument.getElementsByTagName(%27div%27)%3Bvar linkcount%3D0%3Bvar linkLocation%3D%27%27%3Bvar linkAnchorText%3D%27%27%3Boutput%2B%3D%27<table><th>ID</th><th>Link</th><th>Anchor</th>%27%3Bfor(i%3D0%3Bi<pageAnchors.length%3Bi%2B%2B)%7Bif(pageAnchors%5Bi%5D.parentNode.getAttribute(%27class%27)!%3D%27_Rm bc%27)%7Bvar anchorText %3D pageAnchors%5Bi%5D.textContent%3Bvar anchorLink %3D pageAnchors%5Bi%5D.href%3Bvar linkAnchor %3D anchorLink %2B %27%5Ct%27%2BanchorText%3Bvar anchorID %3D pageAnchors%5Bi%5D.id%3Bif(anchorLink!%3D%27%27)%7Bif(anchorLink.match(/%5E((%3F!google%5C.%7Ccache%7Cblogger.com%7C%5C.yahoo%5C.%7Cyoutube%5C.com%5C/%5C%3Fgl%3D%7Cyoutube%5C.com%5C/results%7Cjavascript:%7Capi%5C.technorati%5C.com%7Cbotw%5C.org%5C/search%7Cdel%5C.icio%5C.us%5C/url%5C/check%7Cdigg%5C.com%5C/search%7Csearch%5C.twitter%5C.com%5C/search%7Csearch%5C.yahoo%5C.com%5C/search%7Csiteanalytics%5C.compete%5C.com%7Ctools%5C.seobook%5C.com%5C/general%5C/keyword%5C/suggestions%7Cweb%5C.archive%5C.org%5C/web%5C/%7Cwhois%5C.domaintools%5C.com%7Cwww%5C.alexa%5C.com%5C/data%5C/details%5C/main%7Cwww%5C.bloglines%5C.com%5C/search%7Cwww%5C.majesticseo%5C.com%5C/search%5C.php%7Cwww%5C.semrush%5C.com%5C/info%5C/%7Cwww%5C.semrush%5C.com%5C/search%5C.php%7Cwww%5C.stumbleupon%5C.com%5C/url%7Cwikipedia.org%5C/wiki%5C/Special:Search).)*%24/i))%7Bif(anchorID.match(/%5E((%3F!hdtb_more%7Chdtb_tls%7Cuh_hl).)*%24/i))%7BlinkLocation%2B%3DanchorLink%2B%27<br />%27%3BlinkAnchorText%2B%3DanchorText%2B%27<br />%27%3Blinkcount%2B%2B%3Bif (anchorText %3D%3D%3D undefined) anchorText %3D pageAnchors%5Bi%5D.innerText%3Boutput%2B%3D%27<tr>%27%3Boutput%2B%3D%27<td>%27%2Blinkcount%2B%27</td>%27%3Boutput%2B%3D%27<td>%27%2BpageAnchors%5Bi%5D.href%2B%27</a></td>%27%3Boutput%2B%3D%27<td>%27%2BanchorText%2B%27</td>%27%3Boutput%2B%3D%27</tr>%5Cn%27%3B%7D%7D%7D%7D%7Doutput%2B%3D%27</table><br/><h2>URL List</h2><div>%27%3Boutput%2B%3DlinkLocation%3Boutput%2B%3D%27</div><br/><h2>Anchor Text List</h2><div>%27%3Boutput%2B%3DlinkAnchorText%3Boutput%2B%3D%27<br/> <br/><p align%3Dcenter><a href%3D%5C%27http://www.chrisains.com%5C%27>www.chrisains.com</a></p>%27%3Bwith(window.open())%7Bdocument.write(output)%3Bdocument.close()%3B%7D%7D)()%3B
Cómo instalar el script
- Abrir el administrador de marcadores en Google Chrome (Ctrl. + Shift + O)
- Dentro del recuadro ‘Organizar’, hacer click con el botón secundario y seleccionar la opción ‘Añadir página…’
- En el campo de ‘Nombre’, escribí algo que te permita identificar el script. Yo le puse ‘Chequear indexación».
- En el campo de ‘URL’, pegar el script que aparece en la parte superior y apretar Enter.
¡Y listo! Ya debería aparecer el snippet en tus bookmarks (Ctrl. + Shift + B para mostrar/ocultar la barra de marcadores).
Cómo copiar las URLs indexadas de Google
- En la configuración de búsqueda de Google dentro de ‘Preferencias’, seleccioná la opción que permite ver 100 resultados por página y guardá los cambios.
- Buscá todas las páginas para el sitio que necesites. En nuestro caso, vamos a buscar todas las páginas indexadas para adbot.com.ar. Se tiene que buscar site:adbot.com.ar.
- Click en el snippet que agregamos en la barra de marcadores
- La información parseada se abre automáticamente
- Seleccioná lo que necesites y pegalo en un Google Sheets o Excel para trabajarlo.
Al cliquear el marcador, se abre la siguiente pestaña:
De más está decir que esta es sólo una forma de copiar las URLs de los resultados de búsqueda de Google. Si usás otro método para lograr lo mismo, dejanos un comentario abajo.
Comments (3)
Excelentissimo aporte, hacia tiempo que andaba buscando algo de este estilo para eliminar de los resultados url indexadas de dominios expirados.
Gracias a esto junto a la extensión de Github para modo Bulk en Google SC, se hace en un pis pas!
Mil gracias socio!
Ha sido extremadamente útil. muchas gracias por compartir.
hace algunos meses lo realizé con otro método, pero no lo recuerdo, en todo caso este ha sido muy fácil de ejecutar.
Saludos desde Colombia.
son unos bellos, gracias miles #kissesmiamer