Com rastrejar un lloc gran i extreure dades mitjançant l’aranya SEO de Screaming Frog

Screaming Frog SEO Spider

En aquest moment assistim a diversos clients Migracions Marketo. Com que les grans empreses utilitzen solucions empresarials com aquesta, és com una teranyina que es va teixint en processos i plataformes al llarg dels anys ... fins al punt que les empreses ni tan sols són conscients de tots els punts de contacte.

Amb una plataforma d’automatització de màrqueting empresarial com Marketo, els formularis són el punt d’entrada de dades a través de llocs i pàgines de destinació. Les empreses solen tenir milers de pàgines i centenars de formularis al llarg dels seus llocs que cal identificar per actualitzar-los.

Una bona eina per a això és Aranya SEO de Screaming Frog... potser la plataforma més popular del mercat per rastrejar, auditar i extreure dades d'un lloc. La plataforma és rica en funcions i ofereix centenars d’opcions per a pràcticament totes les tasques que necessiteu.

Screaming Frog SEO Spider: Rastrejar i extreure

Una característica clau de Screaming Frog SEO Spider és que podeu realitzar extraccions personalitzades basades en regex, XPath, O CSSPath detalls. Això resulta molt útil, ja que volem rastrejar els llocs del client i auditar i capturar els valors MunchkinID i FormId de les pàgines.

Amb l'eina, obriu Configuració> Personalitzat> Extracció per identificar els elements que voleu extreure.

extracció personalitzada de screamingfrog

La pantalla d’extracció permet la recollida de dades pràcticament il·limitada:

Regles d’extracció d’aranya SEO Screaming Frog

Extracció de Regex, XPath i CSSPath

Per al MunchkinID, l'identificador es troba dins de l'script de formulari que hi ha a la pàgina:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

A continuació, apliquem un Regla regex per capturar l'identificador des de l'etiqueta de script que s'insereix a la pàgina:

Regex: ["']id["']: *["'](.*?)["']

Per a l'identificador de formulari, les dades es troben en una etiqueta d'entrada dins del formulari Marketo:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Aplicem un Regla XPath per capturar l'identificador des del formulari inserit a la pàgina. La consulta XPath busca un formulari amb una entrada amb un nom de formid, llavors l'extracció desa el fitxer valor:

XPath: //form/input[@name="formid"]/@value

Granota cridant Representació SEO Javascript Spider

Una altra gran opció de Screaming Frog és que no us limiteu a l'HTML de la pàgina, podeu representar qualsevol JavaScript que inserirà formularis al vostre lloc. Dins Configuració> Aranya, podeu anar a la pestanya Renderització i activar-la.

Granota cridant Representació SEO Javascript Spider

Això triga una mica més a rastrejar el lloc, per descomptat, però obtindreu formularis que es renderitzaran al costat del client amb JavaScript, així com formularis que s’inseriran al servidor.

Tot i que es tracta d’una aplicació molt específica, és increïblement útil ja que treballeu amb llocs grans. Us recomanem que auditeu on s’incorporen els vostres formularis a tot el lloc.

Descàrrega Screaming Frog SEO Spider

Què et sembla?

Aquest lloc utilitza Akismet per reduir el correu no desitjat. Esbrineu com es processa el vostre comentari.