Màrqueting per correu electrònic i automatitzacióEines de màrqueting

Com rastrejar un lloc gran i extreure dades mitjançant l’aranya SEO de Screaming Frog

Estem ajudant diversos clients en aquests moments amb les migracions de Marketo. A mesura que les grans empreses utilitzen solucions empresarials com aquesta, és com una teranyina que es teixeix en processos i plataformes al llarg dels anys fins que les empreses ni tan sols són conscients de tots els punts de contacte.

Amb una plataforma d'automatització de màrqueting empresarial com Marketo, els formularis són el punt d'entrada de les dades als llocs i pàgines de destinació. Les empreses sovint tenen milers de pàgines i centenars de formularis als seus llocs que s'han d'identificar per actualitzar-los.

Una bona eina per a això és Screaming Frog SEO Spider... potser la plataforma més popular del mercat de SEO per rastrejar, auditar i extreure dades d'un lloc. La plataforma rica en funcions ofereix centenars d'opcions per pràcticament totes les tasques que necessiteu. Tanmateix, les funcions s'estenen molt més enllà de l'optimització per a la cerca, amb una funció increïblement útil per extreure dades del vostre lloc mentre s'està rastrejant.

Screaming Frog SEO Spider: Rastrejar i extreure

Una característica clau de Screaming Frog SEO Spider és que podeu realitzar extraccions personalitzades basades en regex, XPath, O CSSPath especificitats. Això és extremadament útil, ja que volem rastrejar els llocs del client i auditar i capturar els valors MunchkinID i FormId de les pàgines.

Amb l'eina, obriu Configuració> Personalitzat> Extracció per identificar els elements que voleu extreure.

extracció personalitzada de screamingfrog

La pantalla d’extracció permet la recollida de dades pràcticament il·limitada:

Regles d’extracció d’aranya SEO Screaming Frog

Extracció de Regex, XPath i CSSPath

Per al MunchkinID, l'identificador es troba dins de l'script de formulari que hi ha a la pàgina:

<script type='text/javascript' id='marketo-fat-js-extra'>
    /* <![CDATA[ */
    var marketoFat = {
        "id": "123-ABC-456",
        "prepopulate": "",
        "ajaxurl": "https:\/\/yoursite.com\/wp-admin\/admin-ajax.php",
        "popout": {
            "enabled": false
        }
    };
    /* ]]> */

A continuació, apliquem un Regla regex per capturar l'identificador des de l'etiqueta de script que s'insereix a la pàgina:

Regex: ["']id["']: *["'](.*?)["']

Per a l'identificador de formulari, les dades es troben en una etiqueta d'entrada dins del formulari Marketo:

<input type="hidden" name="formid" class="mktoField mktoFieldDescriptor" value="1234">

Aplicem un Regla XPath per capturar l'identificador des del formulari inserit a la pàgina. La consulta XPath cerca un formulari amb una entrada amb un nom de formidable, llavors l'extracció desa el fitxer valor:

XPath: //form/input[@name="formid"]/@value

Extreu les etiquetes d'estil en línia

Estem ajudant a un client a netejar un lloc on utilitzava estils en línia al connector Elementor per personalitzar pràcticament tots els elements amb una pàgina. Per identificar on s'han utilitzat els estils en línia, hem raspat el lloc amb diverses regles RegEx per a l'extracció personalitzada:

  • Estil en línia d'abast:
<span\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
  • Estil en línia de l'etiqueta d'ancoratge:
<a\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
  • Estil en línia de l'etiqueta Div:
<div\s+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"
  • Estil en línia de l'etiqueta de capçalera:
<h+(?:[^>]*?\s+)?style\s*=\s*"([^"]*)"

Exclusions

At Martech Zone, oferim el lloc en diversos idiomes en diferents subdominis. No és necessari rastrejar aquestes traduccions, ja que tots els recursos i la informació es basen en el lloc principal. Per això, vam habilitar la configuració de la llista d'exclusió i vam afegir la regla següent:

.*\.martech.zone

També podeu utilitzar-lo per ometre el rastreig de camins innecessaris, com ara etiquetes, afegint:

martech.zone/tag/.*

Tampoc volem rastrejar les nostres pàgines AMP, que acaben en ?amp=1, així que a la

Configuració > Exclou secció, també hem afegit:

https?://[^\s]+?\?amp=1

La plataforma fins i tot té un bon mètode per provar-ne alguns URL contra les regles per assegurar-vos que funcionin correctament abans de rastrejar el vostre lloc.

ScreamingFrog > Configuració > Exclou

Screaming Frog SEO Spider Representació de JavaScript

Una altra gran opció de Screaming Frog és que no us limiteu a HTML a la pàgina, podeu representar qualsevol JavaScript que inserirà formularis al vostre lloc. Dins Configuració> Aranya, podeu anar a la pestanya Renderització i activar-la.

Screaming Frog SEO Spider Representació de JavaScript

Això triga una mica més a rastrejar el lloc, per descomptat, però obtindreu formularis que es renderitzaran al costat del client amb JavaScript, així com formularis que s’inseriran al servidor.

Tot i que es tracta d’una aplicació molt específica, és increïblement útil ja que treballeu amb llocs grans. Us recomanem que auditeu on s’incorporen els vostres formularis a tot el lloc.

Descàrrega Screaming Frog SEO Spider

Divulgació: Martech Zone està utilitzant els seus enllaços d'afiliació en aquest article.

Douglas Karr

Douglas Karr és CMO de OpenINSIGHTS i el fundador de la Martech Zone. Douglas ha ajudat a desenes d'empreses d'èxit de MarTech, ha ajudat en la diligència deguda de més de 5 mil milions de dòlars en adquisicions i inversions de Martech i continua ajudant les empreses a implementar i automatitzar les seves estratègies de vendes i màrqueting. Douglas és un expert i conferenciant de MarTech en transformació digital reconegut internacionalment. Douglas també és autor publicat d'una guia de Dummie i d'un llibre sobre lideratge empresarial.

Articles Relacionats

Torna al botó superior
a prop

Adblock detectat

Martech Zone és capaç de proporcionar-vos aquest contingut sense cap cost perquè monetitzem el nostre lloc mitjançant ingressos publicitaris, enllaços d'afiliats i patrocinis. Agrairem que elimineu el bloquejador d'anuncis mentre visualitzeu el nostre lloc.