Indicizzazione rapida delle pagine. Un modo rapido per verificare l'indicizzazione delle pagine in Yandex e Google. Scrivere la lettera corretta a Yandex

Da questo materiale imparerai:

  • Cos'è l'indicizzazione
  • Come aggiungere un sito al database
  • Come velocizzare l'indicizzazione

Cos'è l'indicizzazione?

Ve ne abbiamo già parlato. In breve, queste sono le risposte alle domande degli utenti che digitano in un motore di ricerca. Se fai clic su "acquista un elefante", otterrai siti che offrono elefanti all'ingrosso e al dettaglio. Yandex o Google non mostreranno finestre di plastica né chiameranno le ragazze per tali richieste. E ora attenzione, la domanda: tutti i siti entrano nei risultati di ricerca? No, non tutti. Come minimo, i motori di ricerca devono essere a conoscenza dell'esistenza di questo sito e del contenuto in esso pubblicato. Dopotutto, come puoi mostrare qualcosa che nessuno conosce? Ci sono database di siti Web per questo. In breve, l'aggiunta di un sito con il suo contenuto a questo database si chiama indicizzazione. Come funziona l'indicizzazione? Il robot Yandex o Google funziona secondo i propri algoritmi: cerca informazioni sul tuo sito (queste informazioni includono articoli chiave, testi, foto, ecc. - in una parola, tutto il contenuto). È come una radiografia, scansiona ogni pagina del sito, la analizza, la scansiona e aggiunge il tuo sito al database. Ora verrà visualizzato nei risultati di ricerca e mostrato in risposta alle domande degli utenti. E in quali posizioni - leader o outsider - dipende dal contenuto con cui è riempito. Naturalmente, l'indicizzazione del sito è semplicemente necessaria. Quando il tuo sito inizia ad essere visto dai motori di ricerca, i visitatori arrivano e cresce

Come aggiungere un sito al database?

Supponiamo che tu abbia creato il sito web Mostbestsite.rf. Lo abbiamo riempito, ovviamente, con i migliori contenuti e non vediamo l'ora che raggiunga la vetta. Affinché il sito e i contenuti vengano indicizzati e inclusi nel database, è possibile utilizzare due metodi.
  1. Attendi l'autoindicizzazione. Prima o poi, i robot troveranno il tuo sito: per fare ciò, devi solo lasciare collegamenti attivi ad esso da altre risorse. Si ritiene che più collegamenti ci sono, più veloce sarà l'indicizzazione.
  2. Aggiungi un sito manualmente compilando un modulo speciale nel motore di ricerca. Lì è necessario indicare un collegamento al sito e brevi informazioni su di lui. In Yandex, ad esempio, questo viene fatto nel servizioWebmaster di Yandex Sulla pagina Segnala un nuovo sito .
Lì, in Webmaster, potrai poi monitorare le statistiche delle richieste che portano gli utenti al tuo sito. Anche in Google tutto è semplice: puoi registrare un sito utilizzando il collegamentoCentro webmaster di Google . Quanto è veloce l'indicizzazione? È difficile dire i numeri esatti: dipende dalla fortuna. Ma una cosa sappiamo per certo: Yandex indicizza più lentamente di Google. Ci sono stati casi in cui l'indicizzazione ha richiesto diverse settimane.

Come velocizzare l'indicizzazione?

Gli algoritmi dei motori di ricerca sono una cosa imprevedibile e, come già accennato, non esiste una ricetta esatta. Possiamo consigliare metodi collaudati (essenzialmente gli stessi che influiscono sulla promozione del sito Web nei risultati di ricerca)
  1. Contenuti unici che i motori di ricerca amano così tanto. Una cosa: se hai pubblicato un articolo su un sito o un blog e non è stato ancora indicizzato, in teoria chiunque può rubarlo e postarlo per conto proprio. Se l'articolo è stato indicizzato in precedenza su un altro sito, sei nei guai. Il tuo articolo sarà considerato non unico e il tuo concorrente rimarrà all'oscuro.
  2. Struttura chiara del sito. Segui la regola dei tre clic: puoi accedere a ciascuna pagina dalla pagina principale in non più di tre clic. Meno è bene, di più è meglio! In questo modo faciliterai il compito ai motori di ricerca, che indicizzeranno non solo la pagina principale, ma anche le altre pagine.
  3. Il collegamento con pagine interne è utile sia per i visitatori che per il robot.
  4. Trasmissione di post alle directory RSS. Tutti i tuoi post verranno duplicati nelle directory RSS a cui verranno aggiunti i feed RSS. Si tratta di feed per l'iscrizione agli aggiornamenti di blog o siti Web in modo da ricevere le ultime novità nella tua email. Con il loro aiuto, il motore di ricerca troverà rapidamente i tuoi nuovi articoli e li indicizzerà.

Ecco un esempio di indicizzazione riuscita:

Una settimana fa, su uno dei siti è apparso un articolo su una pistola VPO-213 . Non c'erano praticamente informazioni su questa pistola su Internet: non era ancora apparsa in vendita. C'era solo una breve presentazione in un video su YouTube. Di conseguenza, il testo era assolutamente unico e quasi l'unico su Internet su questo argomento. Verso mezzanotte il testo è stato pubblicato sul sito (neppure nella pagina principale!) ed è stato indicizzato in breve tempo. Alle nove e mezza del mattino del giorno successivo, l'articolo era al terzo posto nei risultati di ricerca Yandex. Alle 9.50 è diventata la prima e mantiene ancora questa posizione.

In generale, se la tua risorsa è buona, ben fatta, non dovrebbero esserci problemi con la sua indicizzazione. Se il sito, sebbene non al 100%, soddisfa i requisiti dei motori di ricerca - "per le persone", saranno felici di guardarti e indicizzare tutto ciò che di nuovo verrà aggiunto.

Comunque sia, il primo passo per promuovere un sito è aggiungerlo all'indice PS. Fino a quando la risorsa non viene indicizzata, in generale non c'è nulla da promuovere, perché i motori di ricerca non lo sapranno affatto. Pertanto, in questo articolo esaminerò cos'è l'indicizzazione del sito in Yandex e come inviare una risorsa per l'indicizzazione. Ti dirò anche come verificare se un sito o una pagina separata è inclusa nell'indice Yandex e cosa fare per accelerare l'indicizzazione da parte di Yandex.

L'indicizzazione di un sito in Yandex viene eseguita dalla scansione dei robot motore di ricerca yandex del tuo sito web e inserendo tutte le pagine aperte nel database. Lo spider del motore di ricerca russo aggiunge dati sul sito al database: pagine, immagini, video, documenti ricercabili. Inoltre, il bot di ricerca è impegnato nell'indicizzazione di collegamenti e altri elementi che non sono nascosti da tag e file speciali.

I modi principali per indicizzare una risorsa:

    Forzato: è necessario inviare il sito per l'indicizzazione a Yandex tramite un modulo speciale.

    Naturale - ragno di ricerca riesce a trovare autonomamente il tuo sito web muovendosi da risorse esterne che si collegano al sito web.

Il tempo necessario per indicizzare un sito in Yandex è diverso per ognuno e può variare da un paio d'ore a diverse settimane.

Ciò dipende da molti fattori: quali valori ci sono in Sitemap.xml, quanto spesso viene riempita la risorsa, quanto spesso compaiono menzioni del sito su altre risorse. Il processo di indicizzazione è ciclico, quindi il robot arriverà da te a intervalli di tempo (quasi) uguali. Ma con quale frequenza dipende dai fattori sopra menzionati e dal robot specifico.

Lo spider può indicizzare l'intero sito web (se è piccolo) o una sezione separata (questo vale per negozi o media online). Su risorse aggiornate di frequente, come portali multimediali e di informazione, vivono i cosiddetti robot veloci per l'indicizzazione rapida del sito in Yandex.

A volte possono verificarsi problemi tecnici (o problemi con il server) sul progetto; in questo caso l'indicizzazione Yandex del sito non avverrà, motivo per cui il motore di ricerca potrebbe ricorrere al seguente scenario:

  • eliminare immediatamente le pagine non indicizzate dal database;
  • reindicizzare la risorsa dopo un certo tempo;
  • imposta le pagine che non sono state indicizzate per essere escluse dal database e, se non le trova durante la reindicizzazione, verrà espulsa dall'indice.

Come accelerare l'indicizzazione del sito in Yandex

Come accelerare l'indicizzazione in Yandex - domande frequenti su vari forum di webmaster. Dall'indicizzazione, infatti, dipende la vita dell'intero sito: la posizione della risorsa nel PS, il numero di clienti da essa, la popolarità del progetto, il profitto, alla fine.

Ho preparato 10 metodi che spero ti possano essere utili. I primi cinque sono standard per l'indicizzazione costante di una risorsa e i successivi cinque ti aiuteranno ad accelerare l'indicizzazione del tuo sito in Yandex:

    servizi di bookmarking;

    Feed RSS: garantirà la trasmissione di nuovi materiali dalla tua risorsa alle e-mail degli abbonati e alle directory RSS;

    scambi di link - garantirà un aumento stabile dei link dofollow da donatori di qualità, se selezionati correttamente (come selezionare correttamente);

    – se non hai ancora registrato il tuo sito nelle directory, allora ti consiglio di farlo. Molte persone dicono che le directory sono morte molto tempo fa o che la registrazione in esse ucciderà il sito: questo non è vero. Più precisamente, non è tutta la verità, se ti registri in tutte le directory di seguito, in effetti la tua risorsa ne soffrirà solo. Ma con la corretta selezione di fiducia e buoni cataloghi, l'effetto sarà senza dubbio.

Controllo dell'indicizzazione del sito in Yandex

  • Gli operatori del sito e dell'URL. Se desideri verificare l'indicizzazione di un sito in Yandex, puoi utilizzare gli operatori dei motori di ricerca standard ..biz. (Naturalmente, invece del mio dominio, il tuo)

  • Barra RDS. Lo considero il modo migliore e più veloce per verificare l'indicizzazione di una pagina in Yandex. Questo plugin può essere installato su tutti i browser più diffusi e verrà fornito immediatamente informazioni dettagliate sul numero di pagine del sito nell'indice e sulla presenza di materiale specifico in esso. Con questa estensione, non perderai tempo inserendo manualmente gli URL nei servizi o nelle ricerche. In generale la consiglio, la barra RDS è estremamente comoda:
  • Serpeverde di servizio. Una risorsa multifunzionale con cui analizzare un sito: valutazione dell’efficacia e monitoraggio dei siti, analisi delle pagine dei concorrenti, controllo delle posizioni e indicizzazione dei siti. Puoi controllare gratuitamente l'indicizzazione della pagina utilizzando questo collegamento: https://serphunt.ru/indexing/. Grazie al controllo batch (fino a 50 indirizzi) e all'elevata affidabilità dei risultati, questo servizio è uno dei tre migliori secondo me.

  • Servizio XSEO. Una serie di strumenti per i webmaster, in XSEO.in puoi guardare l'indicizzazione del sito in Yandex. Ottieni anche molte informazioni utili aggiuntive sulla tua risorsa:

  • Servizi PR-CY e CY-PR. Un paio di altri servizi che ti forniranno informazioni sul numero totale di pagine indicizzate:

  • Servizio di segnalazione del sito. Un servizio eccellente che ti segnalerà tutti gli errori che hai commesso nel lavorare sul sito. Dispone inoltre di una sezione “Indicizzazione”, dove verranno presentate le informazioni per ciascuna pagina del sito, indicando se è indicizzata o meno nei motori di ricerca Yandex e Google. Pertanto, consiglio di utilizzare questa risorsa per rilevare problemi sul sito e controllare l'indicizzazione di massa Yandex:

Hai creato un sito web, ma non riesci a trovarlo nei motori di ricerca? Nessun problema! In questo materiale imparerai come indicizzare un sito web in Yandex e Google nel più breve tempo possibile. Probabilmente non è necessario parlare dei vantaggi di entrare rapidamente nell’indice dei motori di ricerca. Dopotutto, chiunque capisce che prima il suo sito web verrà mostrato nei risultati di ricerca, più velocemente appariranno nuovi clienti. E affinché funzioni, devi accedere al database del motore di ricerca.

A proposito, grazie al giusto approccio, i nuovi materiali sul nostro sito vengono abbastanza bene e, soprattutto, sempre rapidamente indicizzati dai motori di ricerca. Forse sei arrivato a questa pagina dopo aver fatto una richiesta corrispondente a barra di ricerca. Passiamo dai testi alla pratica.

Come scoprire se un sito è indicizzato?

La prima cosa che devi fare è scoprire se il sito è indicizzato dai motori di ricerca. È possibile che il sito semplicemente non si trovi nella prima pagina della ricerca per la query inserita. Potrebbero trattarsi di query ad alto volume su cui è necessario lavorare per essere visualizzate Promozione SEO e non solo creare e lanciare un sito web.

Quindi, per verificare, andiamo su tutti i motori di ricerca che ha senso andare su ( Yandex, Google, Mail, Rambler) e alla linea query di ricerca inserire l'indirizzo del sito.

Se la tua risorsa non è stata ancora indicizzata, non verrà mostrato nulla nei risultati della ricerca oppure appariranno altri siti.

Come indicizzare un sito in Yandex?

Innanzitutto, ti diremo come indicizzare un sito Web in Yandex. Ma prima di aggiungere la tua risorsa, controlla che funzioni correttamente, si apra correttamente su tutti i dispositivi e contenga solo contenuto unico. Ad esempio, se aggiungi un sito in fase di sviluppo, puoi semplicemente cadere sotto il filtro: ci è successo una volta e abbiamo dovuto aspettare un mese intero affinché Yandex capisse che abbiamo un sito di alta qualità e revocasse le sanzioni .

Per informare Yandex di un nuovo sito, devi aggiungilo a Yandex Webmaster E installa Yandex Metrica, il primo strumento è responsabile Informazioni aggiuntive sulla risorsa ( regione, struttura, link rapidi) e l'aspetto del sito nei risultati organici, il secondo per la raccolta dei dati sul sito ( presenze, comportamenti, ecc.), che secondo la nostra esperienza incide anche sull'indicizzazione del sito e sulla sua posizione nei risultati di ricerca. Inoltre, assicurati di creare una mappa del sito e di indicarla nel pannello dei webmaster.

Come indicizzare un sito su Google?

Molto spesso, Google stesso trova rapidamente nuovi siti e li mette in ricerca, ma aspettare che Google venga e faccia tutto il lavoro per noi è troppo presuntuoso, quindi vediamo come indicizzare un sito su Google.

Dopo che i siti sono stati aggiunti, l'operazione dovrebbe essere completata da 3 a 7 giorni, prima che i motori di ricerca aggiornino i dati e indicizzino il sito.

Desideri sempre che le nuove pagine del sito Web appaiano nei risultati di ricerca il più rapidamente possibile, e per questo esistono diversi modi segreti (e molto semplici) per accelerare l'indicizzazione delle pagine del sito Web nei motori di ricerca.

3. Per eseguire la manipolazione descritta al paragrafo 2, solo per il motore di ricerca Sistemi Google, vai a Search Console. Selezionare "Scansione" e "Vedi come Googlebot"-aggiungere l'indirizzo della nuova pagina e fare clic su "Crawn", dopodiché chiediamo l'indicizzazione.

Analisi dell'indicizzazione del sito

In conclusione, va notato che anche dopo aver indicizzato con successo il sito nei motori di ricerca, il lavoro non finisce qui. È necessario analizzare periodicamente l'indicizzazione del sito e rimuovere le posizioni per le query più frequenti. Ciò ti consentirà di tenere il passo con il polso e di non ritrovarti in una situazione in cui una parte significativa del traffico proveniente dai risultati di ricerca organici è semplicemente scomparsa.

Questo è successo a molti vecchi siti che utilizzavano vecchi metodi di promozione dopo il rilascio Algoritmo Yandex Baden-Baden. Allo stesso tempo, Yandex ha annunciato in anticipo che avrebbe lanciato questo algoritmo e che le pagine eccessivamente ottimizzate sarebbero state escluse dalla ricerca, mentre Google non segnala mai il rilascio di nuovi algoritmi. Pertanto, solo un monitoraggio instancabile ti consentirà di rimanere o diventare un leader dell'argomento!

Con Google è tutto molto semplice. Devi aggiungere il tuo sito agli strumenti per i webmaster su https://www.google.com/webmasters/tools/, quindi seleziona il sito aggiunto, entrando così nella Search Console del tuo sito. Successivamente, nel menu a sinistra, seleziona la sezione "Scansione" e in essa la voce "Visualizza come Googlebot".

Nella pagina che si apre, inserisci nel campo vuoto l'indirizzo della nuova pagina che vogliamo indicizzare velocemente (tenendo conto del nome di dominio del sito già inserito) e clicca sul pulsante “Scansione” a destra. Aspettiamo finché la pagina non viene scansionata e appare in cima alla tabella degli indirizzi precedentemente scansionati in modo simile. Successivamente, fai clic sul pulsante “Aggiungi all’indice”.

Evviva, la tua nuova pagina verrà immediatamente indicizzata da Google! In solo un paio di minuti sarai in grado di trovarlo nei risultati di ricerca di Google.

Indicizzazione rapida delle pagine in Yandex

IN nuova versione gli strumenti per i webmaster sono diventati disponibili strumento simile per aggiungere nuove pagine all'indice. Di conseguenza, anche il tuo sito deve essere prima aggiunto a Yandex Webmaster. Puoi anche arrivarci selezionando il sito desiderato nel webmaster, quindi andare nella sezione "Indicizzazione", selezionare la voce "Ri-scansione della pagina". Nella finestra che si apre, inseriamo gli indirizzi delle nuove pagine che vogliamo indicizzare velocemente (tramite un collegamento su un'unica riga).

A differenza di Google, l'indicizzazione in Yandex non avviene ancora istantaneamente, ma sta cercando di raggiungerla. Usando le azioni di cui sopra informerai il robot Yandex nuova pagina. E verrà indicizzato entro mezz'ora o un'ora: questo è ciò che mostra la mia esperienza personale. Forse la velocità di indicizzazione delle pagine in Yandex dipende da una serie di parametri (la reputazione del tuo dominio, account e/o altri). Nella maggior parte dei casi, puoi fermarti qui.

Se vedi che le pagine del tuo sito sono scarsamente indicizzate da Yandex, ovvero esistono diverse raccomandazioni generali su come affrontare questo problema:

  • Il consiglio migliore, ma anche difficile, è installare il Quickbot Yandex sul tuo sito web. Per fare ciò, è consigliabile aggiungere nuovi materiali al sito ogni giorno. Preferibilmente 2-3 o più materiali. Inoltre, aggiungili non tutti in una volta, ma dopo un po ', ad esempio al mattino, pomeriggio e sera. Sarebbe ancora meglio mantenere all'incirca lo stesso programma di pubblicazione (mantenere all'incirca lo stesso tempo per l'aggiunta di nuovi materiali). Inoltre, molti consigliano di creare un feed RSS per il tuo sito robot di ricerca potrebbe leggere gli aggiornamenti direttamente da esso.
  • Naturalmente, non tutti saranno in grado di aggiungere nuovi materiali al sito in tali volumi: va bene se puoi aggiungere 2-3 materiali a settimana. In questo caso, non puoi davvero sognare la velocità di Yandex, ma prova a inserire nuove pagine nell'indice in altri modi. Il più efficace dei quali è considerato la pubblicazione di collegamenti a nuove pagine ad account Twitter aggiornati. Usando programmi speciali come Twidium Accounter, puoi "aumentare" il numero di account Twitter di cui hai bisogno e, con il loro aiuto, inserire rapidamente nuove pagine del sito nell'indice del motore di ricerca. Se non hai la possibilità di pubblicare tu stesso collegamenti ad account Twitter aggiornati, puoi acquistare tali post tramite scambi speciali. Un post con il tuo collegamento costerà in media 3-4 rubli e più (a seconda della forza dell'account selezionato). Ma questa opzione sarà piuttosto costosa.
  • La terza opzione per l'indicizzazione rapida è utilizzare il servizio http://getbot.guru/, che per soli 3 rubli ti aiuterà a ottenere l'effetto desiderato con la garanzia dei risultati. Adatto per siti con un raro programma di aggiunta di nuove pubblicazioni. Ci sono anche tariffe più economiche. È meglio guardare i dettagli e le differenze sul sito web del servizio stesso. Personalmente sono molto soddisfatto dei servizi di questo servizio come acceleratore di indicizzazione.

Naturalmente, puoi anche aggiungere nuovi post ai social bookmark, che in teoria dovrebbero anche aiutare il sito a essere indicizzato rapidamente. Ma l'efficacia di tale aggiunta dipenderà anche dal livello dei tuoi conti. Se hai poca attività su di essi e utilizzi gli account solo per tale spam, non ci sarà praticamente alcun output utile.

PS con una vasta esperienza è sempre rilevante: contattaci!

Ciao, cari lettori del sito del sito. Oggi ti dirò come trovarlo e risolverlo possibili problemi con l'indicizzazione del tuo sito. Consideriamo tre punti principali.

  1. Il robot deve indicizzare le pagine necessarie del sito da;
  2. Queste pagine devono essere indicizzate rapidamente;
  3. Il robot non dovrebbe visitare pagine non necessarie del sito;

Sembra tutto piuttosto semplice. Ma in realtà, la maggior parte dei webmaster affronta gli stessi problemi durante l'impostazione dell'indicizzazione. Osserviamoli attentamente.

Attualmente, nella maggior parte dei casi, se stiamo parlando su una nuova pagina del sito nei risultati di ricerca, apparirà entro poche decine di minuti. Se parliamo di pagine già indicizzate, allora questo 3-5 giorni.

Di conseguenza, affinché il tuo sito venga visitato velocemente, devi ricordare tre regole:

  1. Innanzitutto è necessario disporre di un file della mappa del sito corretto e regolarmente aggiornato;
  2. In secondo luogo, non utilizzare la direttiva Crawl-delay solo se ne hai voglia. In questo momento, assicurati di andare al tuo robots.txt e controlla se esiste tale direttiva. Se è installato, pensa se ne hai davvero bisogno.
  3. In terzo luogo, utilizza la "scansione della pagina" per fare in modo che il robot visiti le pagine più importanti del tuo sito con una nuova pagina importante.

Eliminiamo il robot dalle pagine del sito Web non necessarie

Quando un robot inizia a visitare la tua risorsa, spesso ciò non ha sempre un effetto positivo sull'indicizzazione buone pagine luogo. Immaginiamo una situazione, diciamo che un robot effettua 5 richieste al secondo alla tua risorsa. Sembra un ottimo risultato, ma che senso hanno queste cinque visite al secondo se riguardano tutte pagine di servizio del tuo sito o duplicati e il robot non presta alcuna attenzione alle pagine veramente importanti. Questa è la nostra prossima sezione, come non indicizzare le pagine non necessarie.

  1. Utilizziamo la sezione webmaster Yandex e le statistiche di scansione
  2. Otteniamo gli indirizzi delle pagine che il robot non dovrebbe indicizzare
  3. Compilazione del file robots.txt corretto

Diamo un'occhiata allo strumento Statistiche di scansione, appare così. Ci sono anche dei grafici qui. A noi interessa scorrere un po' la pagina verso il basso, utilizzando il pulsante “tutte le pagine”. Vedrai tutto ciò che il robot ha visitato negli ultimi giorni.

Se tra queste pagine sono presenti pagine di servizio, è necessario vietarle nel file robots.txt. Diamo un'occhiata a cosa esattamente deve essere vietato punto per punto.

  1. Innanzitutto, come ho detto prima, filtraggio delle pagine, la selezione delle merci e l'ordinamento dovrebbero essere vietati nel file robots.txt.
  2. In secondo luogo, lo proibiamo definitivamente varie pagine di azione. Ad esempio, aggiungi per confrontare, aggiungi ai preferiti, aggiungi al carrello. Vietiamo anche la pagina con il carrello stesso.
  3. In terzo luogo, vietiamo l'aggiramento tutte le sezioni di servizio come ricerca nel sito, pannello di amministrazione della tua risorsa, sezioni con dati utente. Ad esempio, anche le informazioni sulla consegna, i numeri di telefono, ecc. non sono consentiti nel file robots.txt.
  4. E Pagine identificative, ad esempio, dovrebbe essere vietata anche la scansione dei tag utm nel file robots.txt utilizzando la direttiva Clean-param.

Se ti trovi di fronte alla domanda se questa pagina debba essere bloccata o se questa pagina debba essere aperta per la scansione, rispondi a una semplice domanda: gli utenti hanno bisogno di questa pagina? motore di ricerca? Se questa pagina non deve essere cercata per query, può essere disabilitata.

E un piccolo caso pratico, spero che ti motiverà. Guarda, su una delle risorse il robot effettua quasi migliaia di chiamate al giorno a pagine con un reindirizzamento. In effetti, le pagine di reindirizzamento sono state aggiunte alle pagine del carrello.

Apportiamo modifiche al file robots.txt e puoi vedere dal grafico che l'accesso a tali pagine è praticamente scomparso. Allo stesso tempo, le dinamiche positive immediate: aggirare le pagine necessarie su questa pagina della steppa con il codice 200 sono aumentate notevolmente.

- Pagine duplicate sul sito, come trovarle e cosa farne

E qui ti aspetta un altro pericolo: questo pagine duplicate. Per duplicati intendiamo più pagine di un sito web accessibili da indirizzi diversi, ma che allo stesso tempo contengono contenuti assolutamente identici. Il pericolo principale dei duplicati è che, se presenti, potrebbero cambiare nei risultati della ricerca. Una pagina potrebbe finire a un indirizzo che non ti serve e competere con la pagina principale che stai promuovendo per alcune richieste. Inoltre, un gran numero di pagine duplicate rende difficile la scansione del sito da parte di un robot di indicizzazione. In generale, portano molti problemi.

Penso che quasi tutti i webmaster siano sicuri che non ci siano pagine duplicate sul loro sito web. Voglio sconvolgerti un po'. In effetti, ci sono duplicati su quasi tutti i siti di RuNet. ? Ho un articolo dettagliato su questo argomento, dopo averlo letto non ti rimarrà una sola domanda.

- Controllo del codice di risposta del server

Oltre al file robots.txt vorrei parlarvi anche dei codici di risposta http corretti. Sembrano anche cose già dette molte volte. Il codice di risposta HTTP stesso rappresenta un determinato stato della pagina per il robot di indicizzazione.

  1. http-200: la pagina può essere indicizzata e la ricerca abilitata.
  2. http-404 significa che la pagina è stata eliminata.
  3. http-301 - pagina reindirizzata.
  4. http-503 - temporaneamente non disponibile.

Qual è il vantaggio di utilizzare lo strumento per correggere i codici http:

  1. In primo luogo, non avrai mai vari collegamenti interrotti alla tua risorsa, ovvero quei collegamenti che portano a pagine che non rispondono con un codice di risposta 200. Se la pagina non esiste, il codice di risposta 404 significa che il robot lo capirà .
  2. In secondo luogo, aiuterà il robot a pianificare la scansione delle pagine realmente necessarie che rispondono con un codice di risposta pari a 200.
  3. E in terzo luogo, ti consentirà di evitare che vari tipi di spazzatura finiscano nei risultati di ricerca.

Questo è esattamente ciò di cui parla il prossimo screenshot, anche questo tratto dalla pratica. Quando una risorsa non è disponibile ed è in corso un lavoro tecnico, il robot riceve uno stub con un codice di risposta http pari a 200. Questa è esattamente la descrizione di questo stub che vedi nei risultati della ricerca.

Poiché la pagina risponde con un codice di risposta pari a 200, vengono restituiti. Naturalmente le pagine con tali contenuti non possono essere localizzate e visualizzate per nessuna richiesta. In questo caso impostazione corretta ci sarà una risposta http 503. Se una pagina o una risorsa è temporaneamente non disponibile, questo codice di risposta eviterà di escludere pagine dai risultati di ricerca.

Queste sono situazioni in cui le pagine importanti e necessarie della tua risorsa diventano inaccessibili al nostro robot, ad esempio rispondono con il codice 503 o 404, o invece vengono restituite a questo stub.

Tali situazioni possono essere monitorate utilizzando lo strumento "pagine importanti". Aggiungi ad esso quelle pagine che portano più traffico alla tua risorsa. Imposta le notifiche via e-mail o servizio e riceverai informazioni su ciò che sta accadendo con questa pagina. Qual è il suo codice di risposta, qual è il suo titolo, quando è stato visitato e qual è il suo stato nei risultati di ricerca.


Puoi verificare la correttezza della restituzione di un particolare codice di risposta utilizzando lo strumento appropriato in Yandex Webmaster (qui). In questo caso controlliamo il codice di risposta delle pagine inesistenti. Ho creato una pagina e l'ho inserita nello strumento, ho fatto clic sul pulsante di controllo e ho ricevuto una risposta 404.

Qui va tutto bene, poiché la pagina non era disponibile, ha risposto correttamente con un codice 404 e non verrà più inclusa nella ricerca. Di conseguenza, per impedire ai robot di visitare pagine non necessarie del sito, utilizzare attivamente lo strumento delle statistiche di scansione, apportare modifiche al file robots.txt e assicurarsi che le pagine restituiscano il codice di risposta http corretto.

- Riassumiamo

Abbiamo fornito al robot le pagine del sito Web corrette con i contenuti. Ci siamo assicurati che venga indicizzato rapidamente. Abbiamo vietato al robot di indicizzare pagine non necessarie. Tutti questi tre grandi gruppi di compiti sono interconnessi. Cioè, se non impedisci al robot di indicizzare le pagine del servizio, molto probabilmente avrà meno tempo per indicizzare le pagine necessarie del sito.

Se il robot non riceve completamente il contenuto delle pagine richieste, non includerà rapidamente queste pagine nei risultati di ricerca. Cioè, devi lavorare sull'indicizzazione della tua risorsa in modo complesso, su tutte e tre queste attività. E in questo caso, otterrai un certo successo affinché le pagine necessarie vengano visualizzate rapidamente nei risultati di ricerca.

Risposte ufficiali Yandex

L'indice includeva pagine in maiuscolo, anche se il sito non contiene tali pagine. Se le pagine sono in maiuscolo, molto probabilmente il robot ha trovato dei collegamenti ad esse da qualche parte su Internet. Controlla prima il tuo sito, molto probabilmente c'è un collegamento errato da qualche parte su Internet. Il robot è arrivato, l'ha visto e ha iniziato a scaricare la pagina in maiuscolo. Per loro, per tali pagine è meglio utilizzare un reindirizzamento 301.

La mappa del sito ha più pagine: è normale? Se stiamo parlando di una mappa del sito, esiste un formato speciale della mappa del sito in cui puoi specificare collegamenti ad altri file della mappa del sito, quindi ovviamente è normale.

Se inserisci collegamenti a tutte le sezioni del catalogo nella parte inferiore del sito, che viene visualizzato su tutte le pagine, ciò aiuterà l'indicizzazione o lo danneggerà? In realtà, non è affatto necessario farlo, ovvero se i visitatori del tuo sito web non ne hanno bisogno, non è necessario aggiungerlo specificamente. È sufficiente solo un file mappa del sito. Il robot scoprirà la presenza di tutte queste pagine e le aggiungerà al suo database.

È necessario indicare la frequenza di aggiornamento nella mappa del sito? Il file della mappa del sito può essere utilizzato per fornire informazioni aggiuntive al robot di indicizzazione. Oltre agli indirizzi stessi, il nostro robot comprende anche molti altri tag. Innanzitutto, questa è la frequenza di aggiornamento, ovvero la frequenza degli aggiornamenti. Questa è la priorità e la data di scansione ultima modifica. Prende tutte queste informazioni dal file della mappa del sito durante l'elaborazione del file e le aggiunge al suo database e le utilizza successivamente per regolare le politiche di scansione.

È possibile fare a meno della mappa del sito? Sì, assicurati che il tuo sito abbia una navigazione chiara, con collegamenti accessibili che conducano a qualsiasi pagina interna. Ma tieni presente che se questa è una nuova risorsa (dall'autore: leggi come lanciare un nuovo sito) e, ad esempio, qualche pagina si trova in profondità nel tuo sito, ad esempio a 5-10 clic di distanza, allora il il robot avrà bisogno di molto tempo per scoprire la sua disponibilità. Primo download pagina iniziale sito, ottieni collegamenti, quindi scarica nuovamente le pagine di cui ha appreso e così via. Il file della mappa del sito ti consente di trasferire informazioni su tutte le pagine al robot contemporaneamente.

Il robot fa 700mila richieste al giorno su pagine inesistenti. Prima di tutto bisogna capire da dove provengono queste pagine inesistenti. Forse i link relativi vengono utilizzati in modo errato sul tuo sito oppure alcune sezioni sono state completamente rimosse dal sito e il robot continua comunque a controllare tali pagine. In questo caso, dovresti semplicemente disabilitarli nel file robots.txt. Entro 12 ore, il robot smetterà di accedere a tali pagine.

Se le pagine del servizio sono indicizzate, come puoi rimuoverle dalla ricerca. Per rimuovere pagine dai risultati di ricerca, utilizza anche robots.txt. Cioè, non importa se imposti il ​​divieto durante la creazione del tuo sito o quando hai lanciato la risorsa. La pagina scomparirà dai risultati di ricerca entro una settimana.

Una mappa del sito generata automaticamente è valida o no? Nella maggior parte dei casi, tutte le mappe dei siti vengono generate automaticamente, quindi possiamo dire che probabilmente è una buona cosa. Non devi fare nulla con le mani e puoi dedicare la tua attenzione a qualcos'altro.

Come verrà indicizzata la pagina se viene resa canonica a se stessa. Se l'attributo canonico porta alla stessa pagina? Questa pagina è considerata canonica? Verrà indicizzato e incluso correttamente nei risultati di ricerca, ovvero l'utilizzo di questa tecnica è abbastanza corretto.

Cosa significa status "non canonico"? Z L'attributo canonico è impostato sulla pagina, che porta a un'altra pagina del tuo sito. Ecco perché questa pagina non sarà in grado di entrare nella ricerca. Aprire fonte pagine, esegui una ricerca, guarda dove conduce la pagina canonica e controlla la pagina canonica nella ricerca.

Cos'è più corretto che una pagina del carrello venga vietata in robots.txt o noindex? Se una pagina è vietata utilizzando il metodo noindex, il robot la visiterà periodicamente e controllerà questo divieto. Per evitare che il robot faccia ciò, è meglio utilizzare un divieto nel file robots.txt.


Ci vediamo! Tieniti aggiornato su tutto e sempre sulle pagine del sito blog

Aiuta il progetto: iscriviti al nostro canale Yandex.Zen!




Superiore