Crawler
Per costruire un CMS potente, hai bisogno di dati provenienti da ogni parte. Un'ottima fonte di contenuti è il tuo sito web. Il Crawler scansiona i contenuti del tuo sito web, che i nostri Connectors possono quindi trasformare in dati strutturati per il tuo CMS in pochi clic. Grazie alle opzioni di configurazione altamente personalizzabili, il Crawler estrae le informazioni esatte che desideri dal tuo sito web, persino il testo dei file PDF che hai archiviato online, facendoti risparmiare tempo e ampliando le tue opzioni di fonti di dati.
Estrai dati dal tuo sito web
Lo Yext Crawler può estrarre il contenuto del tuo file HTML e/o PDF da un insieme specificato di domini, pagine o sottopagine sotto un dominio, dandoti il controllo esatto su quale contenuto viene inserito nel tuo CMS. Se i dati del tuo sito web cambiano costantemente, configura le scansioni in modo che vengano eseguite nei tempi previsti o, se ti serve solo un backfill una sola volta, esegui la scansione una volta. Non vuoi eseguire la scansione di un insieme specifico di pagine? Inserisci facilmente nella blacklist gli URL indesiderati affinché il crawler possa ignorarli.
Configura un crawler
Una volta che il crawler ha finito di perlustrare il tuo sito web, un Connector converte e struttura l'HTML grezzo in dati per le entità. La configurazione altamente personalizzabile consente di estrarre solo i dati necessari. Puoi specificare un percorso di destinazione basato sui selettori CSS o XPath o utilizzare selettori integrati per acquisire i tipi di dati estratti più comunemente, come titoli di pagine e contenuti dei testi. I connettori possono estrarre testo, HTML, URL, immagini e altro. Scopri di più sulla commistione tra Connectors e Crawler qui.
Trasforma i tuoi dati
I dati sul tuo sito web potrebbero non essere formattati esattamente come desideri nel tuo CMS. Utilizza le trasformazioni in Connectors per modificare i dati estratti dal crawler prima che entrino in Content. Grazie a Connectors, puoi visualizzare in anteprima le modifiche ai dati in tempo reale per garantire la massima precisione. Con le trasformazioni, puoi rimuovere caratteri indesiderati, sistemare le lettere maiuscole, trovare e sostituire il testo, formattare le date e molto altro ancora.