Indicizzazione rapida delle pagine. Un modo rapido per controllare l'indicizzazione delle pagine in Yandex e Google. Scriviamo la lettera giusta a Yandex

Da questo materiale imparerai:

  • Cos'è l'indicizzazione
  • Come aggiungere un sito al database
  • Come velocizzare l'indicizzazione

Cos'è l'indicizzazione?

Ve ne abbiamo già parlato. In breve, queste sono risposte alle richieste degli utenti che digitano in un motore di ricerca. Ottieni un punteggio "compra un elefante": ottieni siti che offrono elefanti all'ingrosso e al dettaglio. Finestre di plastica o ragazze squillo per tali richieste Yandex o Google non verranno visualizzate. E ora attenzione, la domanda è: ogni sito entra nei risultati di ricerca? No, non tutti. Come minimo, è necessario che i motori di ricerca siano a conoscenza dell'esistenza di questo sito e del contenuto che vi viene pubblicato. Dopotutto, come puoi mostrare qualcosa che nessuno sa? Ecco a cosa servono i database. In breve, l'aggiunta di un sito con il suo contenuto a questo database si chiama indicizzazione. Come si fa l'indicizzazione? Il robot Yandex o Google agisce secondo i propri algoritmi: cerca informazioni sul tuo sito (queste informazioni includono articoli chiave, testi, foto, ecc. - in una parola, tutti i contenuti). È come una radiografia, risplende attraverso ogni pagina del sito, la analizza, scansiona e aggiunge il tuo sito al database. Ora verrà visualizzato nei risultati di ricerca e mostrato in risposta alle richieste degli utenti. E in quali posizioni - nei leader o negli estranei - dipende dal contenuto di cui è pieno. Naturalmente, l'indicizzazione del sito è semplicemente necessaria. Quando i motori di ricerca iniziano a vedere il tuo sito, i visitatori lo visitano e cresce.

Come aggiungere un sito al database?

Diciamo che hai creato il sito Bestbestsite.rf. L'ho riempito, ovviamente, con i migliori contenuti e non vedo l'ora che arrivi in ​​cima. Affinché il sito e il contenuto vengano indicizzati e inseriti nel database, è possibile utilizzare due metodi.
  1. Attendere l'autoindicizzazione. Prima o poi, i robot troveranno il tuo sito: per questo devi solo lasciare collegamenti attivi ad esso da altre risorse. Si ritiene che maggiore è il numero di collegamenti, più veloce sarà l'indicizzazione.
  2. Aggiungi un sito manualmente compilando un modulo speciale nel motore di ricerca. Lì è necessario specificare un collegamento al sito e brevi informazioni su di lui. In Yandex, ad esempio, questo viene fatto nel servizioWebmaster di Yandex Sulla pagina Segnala un nuovo sito .
Nello stesso posto in Webmaster, puoi quindi monitorare le statistiche delle richieste che portano gli utenti al tuo sito. Anche in Google tutto è semplice: puoi registrare un sito utilizzando il linkCentro webmaster di Google . Quanto è veloce l'indicizzazione? È difficile dire i numeri esatti: è altrettanto fortunato. Ma una cosa sappiamo per certo: Yandex indicizza più lentamente di Google. Ci sono stati casi in cui era prevista l'indicizzazione per diverse settimane.

Come velocizzare l'indicizzazione?

Gli algoritmi dei motori di ricerca sono una cosa imprevedibile e, come già accennato, non esiste una ricetta esatta. Possiamo consigliare metodi collaudati (essenzialmente gli stessi che influenzano la promozione del sito web nei risultati di ricerca)
  1. Contenuti unici che i motori di ricerca amano così tanto. Un punto: se hai pubblicato un articolo su un sito web o blog e non è stato ancora indicizzato, chiunque può teoricamente rubarlo e ospitarlo. Se su un altro sito l'articolo è indicizzato in precedenza, sei nello span. Il tuo articolo sarà considerato non unico e il concorrente rimarrà nel cioccolato.
  2. Chiara struttura del sito. Segui la regola dei tre clic: puoi accedere a ciascuna pagina da quella principale in non più di tre clic. Meno è bene, più è meglio no! Ciò renderà più facile per i motori di ricerca indicizzare non solo la pagina principale, ma anche altre pagine.
  3. Il collegamento con le pagine interne è utile sia per i visitatori che per il robot.
  4. Trasmetti i post alle directory RSS. Tutti i tuoi post verranno duplicati nelle directory RSS, dove vengono aggiunti i feed RSS. Si tratta di feed per l'iscrizione agli aggiornamenti di blog o siti Web in modo da ricevere le ultime novità nella posta. Con il loro aiuto, il motore di ricerca troverà rapidamente i tuoi nuovi articoli e li indicizzerà.

Ecco un esempio di indicizzazione riuscita

Una settimana fa, su uno dei siti è apparso un articolo su una pistola. VPO-213 . Non c'erano praticamente informazioni su questa pistola sul Web: non è ancora apparsa in vendita. C'era solo una breve presentazione in un video di YouTube. Di conseguenza, il testo era completamente unico e quasi l'unico su Internet su questo argomento. Verso mezzanotte il testo è stato pubblicato sul sito (nemmeno nella pagina principale!) e in breve tempo indicizzato. Alle dieci e mezza del mattino successivo, l'articolo era al terzo posto nei risultati di ricerca di Yandex. Alle 9.50 è diventata la prima e ricopre queste posizioni fino ad ora.

In generale, se la tua risorsa è buona, ben fatta, non dovrebbero esserci problemi con la sua indicizzazione. Se il sito, anche se non al 100%, soddisfa i requisiti dei motori di ricerca - "per le persone", allora saranno felici di guardarti alla luce e indicizzare tutto ciò che verrà aggiunto di nuovo.

Comunque sia, il primo passo per promuovere un sito è aggiungerlo all'indice PS. Fino a quando la risorsa non viene indicizzata, in generale, non c'è nulla da promuovere, perché i motori di ricerca non lo sapranno affatto. Pertanto, in questo articolo considererò cos'è l'indicizzazione del sito in Yandex e come inviare una risorsa per l'indicizzazione. Ti dirò anche come verificare se un sito o una pagina separata è inclusa nell'indice Yandex e cosa fare per accelerare l'indicizzazione da parte di Yandex.

L'indicizzazione di un sito in Yandex è un bypass dei robot motore di ricerca yandex del tuo sito e aggiungendo tutte le pagine aperte al database. Lo spider del motore di ricerca russo aggiunge dati sul sito al database: le sue pagine, immagini, video, documenti disponibili per la ricerca. Inoltre, il bot di ricerca è impegnato nell'indicizzazione di collegamenti e altri elementi che non sono chiusi con tag e file speciali.

I modi principali per indicizzare una risorsa:

    Forzato: dovresti inviare il sito per l'indicizzazione in Yandex tramite un modulo speciale.

    Naturale - ricerca ragno riesce a trovare autonomamente il tuo sito passando da risorse esterne che rimandano al sito web.

Il tempo per indicizzare un sito in Yandex è diverso per tutti e può variare da un paio d'ore a diverse settimane.

Dipende da molti fattori: quali valori ci sono in Sitemap.xml, quanto spesso viene riempita la risorsa, quanto spesso appare la menzione del sito su altre risorse. Il processo di indicizzazione è ciclico, quindi il robot verrà da te a intervalli di tempo (virtualmente) uguali. Ma con quale frequenza dipende dai fattori sopra menzionati e dal robot specifico.

Lo spider può indicizzare l'intero sito Web (se è piccolo) o una sezione separata (questo vale per negozi online o media). Su risorse aggiornate di frequente, come media e portali di informazione, sono presenti i cosiddetti robot veloci per indicizzare rapidamente un sito in Yandex.

A volte il progetto potrebbe riscontrare problemi tecnici (o problemi con il server), nel qual caso l'indicizzazione yandex del sito non avrà luogo, a causa della quale il motore di ricerca potrebbe ricorrere al seguente scenario:

  • eliminare immediatamente le pagine non indicizzate dal database;
  • reindicizzare la risorsa dopo un certo tempo;
  • inserire le pagine che non sono state indicizzate per essere escluse dal database e, se non vengono trovate durante la reindicizzazione, verranno eliminate dall'indice.

Come velocizzare l'indicizzazione del sito in Yandex

Come velocizzare l'indicizzazione in Yandex - domande frequenti su vari forum di webmaster. Dall'indicizzazione, infatti, dipende la vita dell'intero sito: la posizione della risorsa nel PS, il numero di clienti da essa, la popolarità del progetto, il profitto, alla fine.

Ho preparato 10 modi che spero possano esserti utili. I primi cinque sono standard per l'indicizzazione permanente della risorsa e i seguenti cinque ti aiuteranno ad accelerare l'indicizzazione del sito in Yandex:

    servizi di segnalibro;

    RSS-feed - assicurerà la trasmissione di nuovi materiali dalla tua risorsa alla posta degli abbonati e alle directory RSS;

    scambi di link - forniranno un aumento stabile dei link dofollow da donatori di qualità, con la loro corretta selezione (come selezionare correttamente);

    - se non hai ancora registrato il sito nelle directory, ti consiglio di farlo. Molte persone dicono che le directory sono morte da tempo o che la registrazione in esse ucciderà il sito - questo non è vero. Più precisamente, non tutta la verità, se ti registri in tutte le directory di seguito, la tua risorsa ne risentirà solo. Ma con la giusta selezione di fiducia e buoni cataloghi, l'effetto sarà innegabile.

Controllo dell'indicizzazione del sito in Yandex

  • operatori del sito e dell'URL. Se desideri controllare l'indicizzazione del sito in Yandex, puoi utilizzare gli operatori standard del motore di ricerca..biz. (Certo, invece del mio dominio, il tuo)

  • Barra RDS. Penso che il modo migliore e più veloce per controllare l'indicizzazione delle pagine in Yandex. Questo plugin può essere installato su tutti i browser più diffusi, fornire immediatamente informazioni dettagliate sul numero di pagine del sito nell'indice e sulla presenza di materiale specifico in esso. Con questa estensione, non perderai tempo a inserire manualmente gli URL nei servizi o nelle ricerche. In generale, consiglio che la barra RDS sia estremamente conveniente:
  • Serpeverde di servizio. Una risorsa multifunzionale con la quale è possibile analizzare il sito: valutare l'efficacia e monitorare i siti, analizzare le pagine della concorrenza, controllare le posizioni e indicizzare il sito. Puoi controllare l'indicizzazione della pagina gratuitamente a questo link: https://serphunt.ru/indexing/. Grazie al controllo batch (fino a 50 indirizzi) e all'elevata affidabilità dei risultati, secondo me questo servizio è tra i primi tre.

  • Servizio XSEO. Una serie di strumenti per i webmaster, in XSEO.in puoi vedere l'indicizzazione del sito in Yandex. Ottieni anche molte informazioni utili aggiuntive sulla tua risorsa:

  • Servizi PR-CY e CY-PR. Un altro paio di servizi che ti forniranno informazioni sul numero totale di pagine indicizzate:

  • servizio di segnalazione del sito. Un ottimo servizio che segnalerà tutti i tuoi errori nel lavorare sul sito. Dispone inoltre di una sezione "Indicizzazione", dove verranno fornite informazioni per ogni pagina del sito indicando se è indicizzata o meno nei motori di ricerca Yandex e Google. Pertanto, consiglio di utilizzare questa risorsa per rilevare problemi sul sito e controllare l'indicizzazione di massa Yandex:

Hai creato un sito web, ma non riesci a trovarlo nei motori di ricerca? Nessun problema! In questo articolo imparerai come indicizzare un sito su Yandex e Google nel più breve tempo possibile. Probabilmente non è necessario parlare dei vantaggi di entrare rapidamente nell'indice dei motori di ricerca. Dopotutto, chiunque capisce che prima il suo sito verrà mostrato nei risultati di ricerca, più velocemente appariranno nuovi clienti. E affinché funzioni, devi entrare nel database dei motori di ricerca.

A proposito, grazie al giusto approccio, i nuovi materiali del nostro sito vanno abbastanza bene e, soprattutto, vengono sempre rapidamente indicizzati dai motori di ricerca. Forse sei arrivato a questa pagina anche dopo aver contattato la richiesta corrispondente in linea di ricerca. Dai testi, passiamo alla pratica.

Come scoprire se il sito è indicizzato?

La prima cosa da fare è scoprire se il sito è indicizzato dai motori di ricerca. È possibile che il sito semplicemente non si trovi nella prima pagina della ricerca per la query che hai inserito. Queste possono essere query ad alta frequenza su cui è necessario lavorare per essere mostrate. Promozione SEO e non solo creare e gestire un sito web.

Quindi, per verificare, andiamo su tutti i motori di ricerca a cui ha senso andare ( Yandex, Google, Posta, Rambler) e nella stringa query di ricerca inserire l'indirizzo del sito web.

Se la tua risorsa non è ancora stata indicizzata, non verrà mostrato nulla nei risultati di ricerca o appariranno altri siti.

Come indicizzare un sito in Yandex?

Per cominciare, ti diremo come indicizzare un sito in Yandex. Ma prima di aggiungere la tua risorsa, controlla che funzioni correttamente, si apra correttamente su tutti i dispositivi e contenga solo contenuto unico. Ad esempio, se aggiungi un sito in fase di sviluppo, puoi semplicemente cadere sotto il filtro: ci è successo una volta e abbiamo dovuto aspettare un mese intero prima che Yandex capisse che abbiamo un sito di qualità e revocasse le sanzioni.

Per informare Yandex di un nuovo sito, è necessario aggiungilo a Yandex Webmaster E installare Yandex Metrica, il primo strumento è responsabile Informazioni aggiuntive sulla risorsa ( regione, struttura, collegamenti rapidi) e l'aspetto del sito nei risultati dell'emissione organica, il secondo per la raccolta dei dati sul sito ( frequenza, comportamento, ecc.), che, secondo la nostra esperienza, influisce anche sull'indicizzazione del sito e sulla sua posizione nella ricerca. E assicurati di creare una mappa del sito e di specificarla nel pannello dei webmaster.

Come indicizzare un sito su Google?

Molto spesso, Google stesso trova rapidamente nuovi siti e li guida nella ricerca, ma aspettare che Google venga a fare tutto il lavoro per noi è troppo arrogante, quindi scopriamo come indicizzare un sito su Google.

Dopo che i siti sono stati aggiunti, dovrebbe passare 3 a 7 giorni prima che i motori di ricerca aggiornino i dati e indicizzino il sito.

Desideri sempre che le nuove pagine del sito vengano visualizzate nei risultati di ricerca il più rapidamente possibile e per questo esistono diversi modi segreti (e molto semplici) per accelerare l'indicizzazione delle pagine del sito nei motori di ricerca.

3. Per eseguire la manipolazione descritta nel paragrafo 2, solo per il motore di ricerca Google, vai alla Search Console. Seleziona "Scansione" e "Guarda come Googlebot"-aggiungere l'indirizzo di una nuova pagina e fare clic su "Scansione", dopodiché richiediamo l'indicizzazione.

Analisi dell'indicizzazione del sito web

In conclusione, va notato che anche dopo la corretta indicizzazione del sito nei motori di ricerca, il lavoro non finisce qui. È necessario analizzare periodicamente l'indicizzazione del sito, nonché rimuovere posizioni per query popolari. Ciò ti consentirà di tenere il polso del polso e di non trovarti in una situazione in cui una parte significativa del traffico proveniente dall'emissione organica è semplicemente scomparsa.

Questo è successo a molti vecchi siti che utilizzavano i vecchi metodi di promozione dopo essere usciti. Algoritmo di Yandex Baden-Baden. Allo stesso tempo, Yandex ha annunciato in anticipo che stava lanciando questo algoritmo e le pagine riottimizzate sarebbero state escluse dalla ricerca, mentre Google non ha mai annunciato il rilascio di nuovi algoritmi. Pertanto, solo un controllo implacabile ti consentirà di rimanere il leader dell'argomento o di diventarlo!

Tutto è molto semplice con Google. Devi aggiungere il tuo sito agli strumenti per i webmaster su https://www.google.com/webmasters/tools/, quindi seleziona il sito aggiunto, entrando così nella Search Console del tuo sito. Successivamente, nel menu a sinistra, seleziona la sezione "Scansione" e in essa la voce "Visualizza come Googlebot".

Nella pagina che si apre, nel campo vuoto, inseriamo l'indirizzo della nuova pagina che vogliamo indicizzare velocemente (tenendo conto del nome a dominio del sito già inserito) e clicchiamo sul pulsante “Scansione” a destra. Stiamo aspettando che la pagina venga scansionata e appaia in cima alla tabella degli indirizzi precedentemente scansionati in questo modo. Successivamente, fai clic sul pulsante "Aggiungi all'indice".

Evviva, la tua nuova pagina viene immediatamente indicizzata da Google! In un paio di minuti sarai in grado di trovarlo nei risultati di ricerca di Google.

Indicizzazione rapida delle pagine in Yandex

IN nuova versione strumenti per i webmaster sono diventati disponibili strumento simile per aggiungere nuove pagine all'indice. Di conseguenza, anche il tuo sito deve essere precedentemente aggiunto a Yandex Webmaster. Puoi anche arrivarci selezionando il sito desiderato nel webmaster, quindi vai nella sezione "Indicizzazione", seleziona la voce "Ripetizione della pagina". Nella finestra che si apre, inseriamo gli indirizzi delle nuove pagine che vogliamo indicizzare velocemente (utilizzando un link su una riga).

A differenza di Google, l'indicizzazione in Yandex non avviene ancora all'istante, ma cerca di lottare per ottenerla. Con le azioni di cui sopra, informerai il robot Yandex di nuova pagina. E verrà indicizzato entro mezz'ora o un'ora: ecco come mostra personalmente la mia pratica. Forse la velocità di indicizzazione della pagina in Yandex dipende da una serie di parametri (dalla reputazione del tuo dominio, account e/o altri). Nella maggior parte dei casi, questo può essere interrotto.

Se vedi che le pagine del tuo sito sono scarsamente indicizzate da Yandex, ovvero alcune raccomandazioni generali su come affrontare questo problema:

  • La raccomandazione migliore, ma anche la più difficile, è installare lo speedbot Yandex sul tuo sito. Per fare ciò, è auspicabile aggiungere ogni giorno nuovi materiali al sito. Preferibilmente 2-3 o più materiali. E aggiungili non tutti in una volta, ma dopo un po ', ad esempio al mattino, pomeriggio e sera. Sarebbe ancora meglio seguire approssimativamente lo stesso programma di pubblicazione (mantenere approssimativamente lo stesso tempo per l'aggiunta di nuovi materiali). Inoltre, molte persone consigliano di creare un feed RSS del sito per farlo robot di ricerca potrebbe leggere gli aggiornamenti direttamente da esso.
  • Naturalmente, non tutti saranno in grado di aggiungere nuovi materiali al sito in tali volumi: va bene se puoi aggiungere 2-3 materiali a settimana. In questo caso, non puoi sognare particolarmente la velocità di Yandex, ma prova a inserire nuove pagine nell'indice in altri modi. Il più efficace dei quali è considerato la pubblicazione di collegamenti a nuove pagine negli account Twitter aggiornati. Usando programmi speciali come Twidium Accounter, puoi "pompare" il numero di account Twitter di cui hai bisogno e utilizzarli per guidare rapidamente nuove pagine del sito nell'indice del motore di ricerca. Se non hai l'opportunità di pubblicare link agli account Twitter aggiornati da solo, puoi acquistare tali post tramite scambi speciali. Un post con il tuo link in media costerà da 3-4 rubli e più (a seconda della freddezza dell'account selezionato). Ma questa opzione sarà piuttosto costosa.
  • La terza opzione per l'indicizzazione rapida è utilizzare il servizio http://getbot.guru/, che per soli 3 rubli ti aiuterà a ottenere l'effetto desiderato con un risultato garantito. Adatto per siti con un programma raro per l'aggiunta di nuove pubblicazioni. Ci sono anche tariffe più economiche. I dettagli e le differenze tra loro sono meglio visualizzati sul sito Web del servizio stesso. Personalmente, sono molto soddisfatto dei servizi di questo servizio come acceleratore di indicizzazione.

Naturalmente, puoi anche aggiungere nuove pubblicazioni ai segnalibri sociali, che dovrebbero teoricamente contribuire anche alla rapida indicizzazione del sito. Ma l'efficacia di tale aggiunta dipenderà anche dal livello dei tuoi account. Se hai poca attività su di essi e usi i tuoi account solo per tale spam, non ci sarà praticamente alcun output utile.

P.S. con una vasta esperienza è sempre aggiornato - contattaci!

Ciao, cari lettori del sito del sito. Oggi ti dirò come trovare e riparare possibili problemi con l'indicizzazione del tuo sito. Diamo un'occhiata a tre punti principali.

  1. Il robot deve indicizzare le pagine necessarie del sito con ;
  2. Queste pagine dovrebbero essere indicizzate rapidamente;
  3. Il robot non dovrebbe visitare pagine non necessarie del sito;

Tutto sembra essere abbastanza semplice. Ma in realtà, la maggior parte dei webmaster affronta gli stessi problemi durante l'impostazione dell'indicizzazione. Osserviamoli attentamente.

Attualmente, nella maggior parte dei casi, se noi stiamo parlando relativa alla nuova pagina del sito nei risultati di ricerca, comparirà entro poche decine di minuti. Se stiamo parlando di pagine già indicizzate, allora questo 3-5 giorni.

Di conseguenza, affinché il tuo sito possa essere visitato rapidamente, devi ricordare tre regole:

  1. Innanzitutto, devi disporre di un file sitemap valido e regolarmente aggiornato;
  2. In secondo luogo, non utilizzare la direttiva Crawl-delay solo se ne hai voglia. In questo momento, assicurati di andare al tuo robots.txt e controlla se esiste una tale direttiva. Se è installato, pensa se ne hai davvero bisogno.
  3. In terzo luogo, utilizza la "scansione della pagina" per visitare le pagine più importanti del tuo sito con una nuova pagina importante.

Salviamo il robot dalle pagine non necessarie del sito

Quando un robot inizia a visitare la tua risorsa, spesso non ha sempre un effetto positivo sull'indicizzazione buone pagine luogo. Immagina una situazione, diciamo che il robot fa 5 richieste al secondo alla tua risorsa. Sembra un ottimo risultato, ma che senso hanno queste cinque visite al secondo se tutte sono relative alle pagine di servizio del tuo sito o duplicate e il robot non presta minimamente attenzione alle pagine veramente importanti. Questa è la nostra prossima sezione su come non indicizzare le pagine non necessarie.

  1. Utilizziamo la sezione Yandex Webmaster e ignoriamo le statistiche
  2. Otteniamo gli indirizzi delle pagine che il robot non deve indicizzare
  3. Componiamo il file robots.txt corretto

Diamo un'occhiata allo strumento "Statistiche di scansione", ha questo aspetto. Ci sono anche grafici qui. Ci interessa scorrere un po' la pagina con il pulsante "tutte le pagine". Vedrai tutto ciò che il robot ha visitato negli ultimi giorni.

Tra queste pagine, se sono presenti pagine di servizio, devono essere vietate nel file robots.txt. Cosa deve essere bandito esattamente, punto per punto.

  1. Innanzitutto, come ho detto prima, filtrare le pagine, la selezione delle merci, lo smistamento dovrebbero essere vietati nel file robots.txt.
  2. In secondo luogo, dobbiamo vietare varie pagine di azione. Ad esempio, aggiungi per confrontare, aggiungi ai preferiti, aggiungi al carrello. Anche la stessa pagina del carrello è vietata.
  3. In terzo luogo, vietiamo il bypass tutte le sezioni di servizio come la ricerca nel sito, il pannello di amministrazione della tua risorsa, le sezioni con i dati dell'utente. Ad esempio, anche le informazioni sulla consegna, i numeri di telefono e così via sono vietati nel file robots.txt.
  4. E pagine con ID, ad esempio, con i tag utm, vale anche la pena vietare la scansione nel file robots.txt utilizzando la direttiva Clean-param.

Se ti trovi di fronte alla domanda se sia necessario vietare o se questa pagina debba essere aperta per aggirare, rispondi a una semplice domanda: se gli utenti hanno bisogno di questa pagina motore di ricerca? Se questa pagina non dovrebbe essere nella ricerca di query, allora può essere vietata.

E un piccolo caso pratico, spero che ti motiverà. Guarda, su una delle risorse, il robot effettua quasi migliaia di accessi al giorno alle pagine con un reindirizzamento. In realtà, le pagine di reindirizzamento erano le pagine di aggiunta al carrello.

Apportiamo modifiche al file robots.txt e si può vedere sul grafico che l'accesso a tali pagine è praticamente scomparso. Allo stesso tempo, la dinamica immediatamente positiva è aumentata notevolmente: aggirare le pagine necessarie su questa pagina della steppa con il codice 200.

- Pagine duplicate sul sito, come trovarle e cosa farne

E qui ti aspetta un altro pericolo: questo è duplicati di pagine. Per duplicati si intendono più pagine dello stesso sito che sono disponibili a indirizzi diversi, ma allo stesso tempo contengono contenuti assolutamente identici. Il pericolo principale dei duplicati è che, se esistono, possono cambiare nei risultati della ricerca. Una pagina può arrivare a un indirizzo che non ti serve, competere con la pagina principale che stai promuovendo per qualsiasi domanda. Inoltre, un gran numero di pagine duplicate rende difficile per un robot di indicizzazione aggirare il sito. In generale, portano molti problemi.

Penso che quasi tutti i webmaster siano sicuri che non ci siano pagine duplicate sulla loro risorsa. Voglio farti arrabbiare un po'. In effetti, ci sono duplicati su quasi tutti i siti di RuNet. ? Ho un articolo dettagliato su questo, dopo averlo letto, non ti resterà una sola domanda.

- Controllo del codice di risposta del server

Oltre al file robots.txt, vorrei parlarti dei codici di risposta http corretti. Sembrano anche cose che sono già state dette più di una volta. Il codice di risposta http stesso è uno stato di pagina specifico per il robot di indicizzazione.

  1. http-200: la pagina può essere indicizzata e abilitata alla ricerca.
  2. http-404 significa che la pagina è stata eliminata.
  3. http-301 - pagina reindirizzata.
  4. http-503 - temporaneamente non disponibile.

Qual è il vantaggio di utilizzare lo strumento di codici http corretto:

  1. In primo luogo, non avrai mai vari collegamenti interrotti alla tua risorsa, ovvero quei collegamenti che portano a pagine che non rispondono con un codice di risposta 200. Se la pagina non esiste, il robot capirà il codice di risposta 404.
  2. In secondo luogo, aiuterà il robot nella pianificazione a bypassare le pagine veramente necessarie che rispondono con un codice di risposta 200.
  3. E in terzo luogo, ti consentirà di evitare di inserire vari rifiuti nei risultati della ricerca.

A proposito di questo solo la schermata successiva è anche dalla pratica. Durante l'indisponibilità della risorsa e del lavoro tecnico, il robot riceve uno stub con un codice di risposta HTTP di 200. Questa è esattamente la descrizione di questo stub che vedi nei risultati della ricerca.

Poiché la pagina risponde con un codice di risposta 200, vengono restituiti. Naturalmente, le pagine con tali contenuti non possono essere individuate e visualizzate per eventuali richieste. In questo caso, l'impostazione corretta sarebbe una risposta http 503. Se una pagina o una risorsa è temporaneamente non disponibile, questo codice di risposta impedirà alle pagine di essere escluse dai risultati di ricerca.

Ecco le situazioni in cui le tue pagine importanti e necessarie della tua risorsa diventano inaccessibili al nostro robot, ad esempio, rispondono con un codice 503 o 404 o ritornano invece a questo stub.

Tali situazioni possono essere monitorate utilizzando lo strumento "pagine importanti". Aggiungi ad esso quelle pagine che portano più traffico alla tua risorsa. Impostazioni per le notifiche alla posta e al servizio e riceverai informazioni su ciò che sta accadendo con questa pagina. Qual è il suo codice di risposta, qual è il suo titolo, quando è stata visitata e qual è il suo stato nei risultati di ricerca.


Puoi verificare la correttezza della restituzione dell'uno o dell'altro codice di risposta utilizzando lo strumento appropriato in Yandex Webmaster (qui). In questo caso, controlliamo il codice di risposta delle pagine inesistenti. Mi è venuta in mente una pagina e l'ho inserita nello strumento, ho premuto il pulsante di spunta e ho ricevuto una risposta 404.

Qui è tutto in ordine, poiché la pagina non era disponibile, ha risposto correttamente con un codice 404 e non sarà più inclusa nella ricerca. Di conseguenza, al fine di impedire ai robot di visitare pagine non necessarie del sito, utilizzare attivamente lo strumento di bypass delle statistiche, apportare modifiche al file robots.txt e assicurarsi che le pagine restituiscano il codice di risposta http corretto.

- Riassumendo

Abbiamo fornito al robot la pagina corretta del sito con i contenuti. Abbiamo ottenuto che venga indicizzato rapidamente. Abbiamo proibito al robot di indicizzare le pagine non necessarie. Tutti e tre questi grandi gruppi di compiti sono interconnessi.. Cioè, se il robot non si limita a indicizzare le pagine del servizio, molto probabilmente avrà meno tempo per indicizzare le pagine necessarie del sito.

Se il robot non riceve l'intero contenuto delle pagine richieste, non includerà rapidamente queste pagine nei risultati di ricerca. Cioè, devi lavorare sull'indicizzazione della tua risorsa in modo complesso, su tutte e tre queste attività. E in questo caso, otterrai un certo successo affinché le pagine desiderate entrino rapidamente nei risultati di ricerca.

Yandex risposte ufficiali

Le pagine in maiuscolo sono state incluse nell'indice, nonostante il sito non contenga tali pagine. Se le pagine sono in maiuscolo, è molto probabile che il robot abbia trovato collegamenti ad esse da qualche parte su Internet. Controlla prima il tuo sito, molto probabilmente un collegamento errato è installato da qualche parte su Internet. Il robot è arrivato, l'ha visto e ha iniziato a scaricare la pagina in maiuscolo. Per loro, per tali pagine, è meglio utilizzare i reindirizzamenti 301.

La mappa del sito ha più pagine: è normale? Se stiamo parlando di una mappa del sito, ovvero uno speciale formato di mappa del sito in cui è possibile specificare collegamenti ad altri file della mappa del sito, ovviamente è normale.

Se inserisci collegamenti a tutte le sezioni del catalogo nella parte inferiore del sito, che viene visualizzato su tutte le pagine, aiuterà l'indicizzazione o danneggerà? In effetti, non è affatto necessario farlo, ovvero se i visitatori del tuo sito non ne hanno bisogno, non è necessario che lo faccia in modo specifico. È sufficiente un semplice file sitemap. Il robot scoprirà la presenza di tutte queste pagine, le aggiungerà al suo database.

Devo specificare la frequenza di aggiornamento nella mappa del sito? Il file della mappa del sito può essere utilizzato per passare informazioni aggiuntive al robot di indicizzazione. Oltre agli indirizzi stessi, il nostro robot comprende anche altri tag. Innanzitutto, questa è la frequenza di aggiornamento, ovvero la frequenza dell'aggiornamento. Questa è la priorità di bypass e la data ultima modifica. Prende tutte queste informazioni dal file della mappa del sito durante l'elaborazione del file e lo aggiunge al suo database e lo utilizza in seguito per regolare le politiche di bypass.

È possibile fare a meno di una mappa del sito? Sì, assicurati che il tuo sito abbia una navigazione trasparente in modo che qualsiasi pagina interna abbia collegamenti accessibili. Ma tieni presente che se questa è una nuova risorsa (dall'autore: leggi come lanciare un nuovo sito) e, ad esempio, qualche pagina è in profondità sul tuo sito, ad esempio, in 5-10 clic, quindi il robot ci vorrà molto tempo per scoprire la sua disponibilità. Scarica prima pagina iniziale site, ottenere collegamenti, quindi scaricare di nuovo quelle pagine di cui ha appreso e così via. Il file della mappa del sito ti consente di trasferire le informazioni su tutte le pagine al robot contemporaneamente.

Il robot effettua 700mila richieste al giorno per pagine inesistenti. Prima di tutto, devi capire da dove provengono tali pagine inesistenti. Forse i collegamenti relativi sul tuo sito vengono utilizzati in modo errato o alcune sezioni sono state rimosse definitivamente dal sito e il robot continua comunque a controllare tali pagine. In questo caso, dovresti semplicemente disabilitarli nel file robots.txt. Entro 12 ore, il robot smetterà di accedere a tali pagine.

Se le pagine del servizio sono indicizzate, come posso rimuoverle dalla ricerca. Utilizza anche robots.txt per rimuovere le pagine dai risultati di ricerca. Cioè, non importa se hai impostato il divieto durante la creazione del tuo sito o quando hai lanciato la risorsa. La pagina scomparirà dai risultati di ricerca entro una settimana.

Una sitemap generata automaticamente è buona o no? Nella maggior parte dei casi, tutte le mappe dei siti vengono generate automaticamente, quindi possiamo dire che questo è probabilmente buono. Non hai bisogno di fare qualcosa con le tue mani e puoi prestare attenzione a qualcos'altro.

Come verrà indicizzata la pagina se resa canonica a se stessa. Se l'attributo canonical porta alla pagina stessa? Questa pagina è considerata canonica? Normalmente verrà indicizzato e incluso nei risultati di ricerca, ovvero è abbastanza corretto utilizzare questa tecnica.

Cosa significa lo stato "non canonico"? z La pagina inizia con il set di attributi canonical, che porta a un'altra pagina del tuo sito. Ecco perché questa pagina non si trova nella ricerca. Aprire fonte pagine, fai una ricerca, vedi dove conduce canonico e controlla la pagina canonica nella ricerca.

Cosa c'è di più corretto che una pagina del carrello degli acquisti venga bannata in robots.txt o noindex? Se la pagina viene disabilitata utilizzando il metodo noindex, il robot la visiterà periodicamente e verificherà la disponibilità questo divieto. Per impedire al robot di farlo, è meglio utilizzare un divieto nel file robots.txt.


Ci vediamo! Fai tutto e sempre sulle pagine del sito del blog

Aiuta il progetto: iscriviti al nostro canale Yandex.Zen!




Superiore