Mitä verkkosivustojen indeksointi on? Miten se tapahtuu? Löydät vastaukset näihin ja muihin kysymyksiin artikkelista. Web-indeksointi (indeksointi hakukoneissa) on prosessi, jossa hakukonerobotti lisää tietoa sivustosta tietokantaan, jota käytetään myöhemmin etsimään tietoja web-projekteista, jotka ovat käyneet läpi tällaisen toimenpiteen.
Verkkoresursseja koskevat tiedot koostuvat useimmiten avainsanoista, artikkeleista, linkeistä ja asiakirjoista. Ääni, kuvat ja niin edelleen voidaan myös indeksoida. Tiedetään, että avainsanan tunnistusalgoritmi on riippuvainen hakukoneesta.
Indeksoidun tiedon tyypeillä (flash-tiedostot, javascript) on joitain rajoituksia.
Aloitushallinta
Sivuston indeksointi on monimutkainen prosessi. Sen hallitsemiseksi (esimerkiksi tietyn sivun liittämisen kieltämiseksi) sinun on käytettävä robots.txt-tiedostoa ja ohjeita, kuten Salli, Disallow, Crawl-delay, User-agent ja muut.
Lisäksi tunnisteita ja rekvisiitta käytetään indeksointiin, mikä piilottaa resurssin sisällön Googlen ja Yandexin roboteilta (Yahoo käyttää tunnistetta).
Goglle-hakukoneessa uudet sivustot indeksoidaan muutamasta päivästä viikkoon ja Yandexissä yhdestä neljään viikkoon.
Haluatko sivustosi näkyvän hakukoneiden hakutuloksissa? Sen jälkeen Rambler, Yandex, Google, Yahoo ja niin edelleen on käsiteltävä se. Sinun on ilmoitettava hakukoneille (hämähäkit, järjestelmät) verkkosivustosi olemassaolosta, ja sitten he indeksoivat sen kokonaan tai osittain.
Monet sivustot ovat olleet indeksoimatta vuosiin. Niissä olevia tietoja ei näe kukaan muu kuin niiden omistajat.
Käsittelytavat
Sivuston indeksointi voidaan tehdä useilla tavoilla:
- Ensimmäinen vaihtoehto on manuaalinen lisääminen. Sinun on syötettävä sivustosi tiedot hakukoneiden tarjoamien erityisten lomakkeiden kautta.
- Toisessa tapauksessa hakukonerobotti itse löytää Web-sivustosi linkkien avulla ja indeksoi sen. Hän löytää sivustosi linkkien avulla muista lähteistä, jotka johtavat projektiisi. Tämä menetelmä on tehokkain. Jos hakukone löytää sivuston tällä tavalla, se pitää sitä tärkeänä.
Ajoitus
Sivuston indeksointi ei ole liian nopeaa. Ehdot vaihtelevat, 1-2 viikkoa. Linkit arvov altaisista resursseista (erinomainen PR ja Titz) nopeuttavat merkittävästi sivuston sijoittamista hakukoneen tietokantaan. Nykyään Googlea pidetään hitaimpana, vaikka vuoteen 2012 asti se voisi tehdä tämän työn viikossa. VastaanottajaValitettavasti asiat muuttuvat hyvin nopeasti. Tiedetään, että Mail.ru on työskennellyt tämän alueen verkkosivustojen kanssa noin kuuden kuukauden ajan.
Sivuston indeksointi hakukoneissa ei ole mahdollista kaikille asiantuntijoille. Hakukoneiden jo käsittelemän sivuston tietokantaan uusien sivujen lisäämisen ajoitukseen vaikuttaa sen sisällön päivitystiheys. Jos resurssille ilmestyy jatkuvasti tuoretta tietoa, järjestelmä pitää sitä usein päivittyvänä ja hyödyllisenä ihmisille. Tässä tapauksessa hänen työnsä nopeutuu.
Voit seurata verkkosivuston indeksoinnin edistymistä verkkovastaaville tai hakukoneille tarkoitetuissa erityisosiossa.
Muutokset
Olemme jo selvittäneet, kuinka sivusto indeksoidaan. On huomattava, että hakukoneiden tietokantoja päivitetään usein. Siksi niihin lisättyjen projektisi sivujen määrä voi muuttua (sekä pienentyä että kasvaa) seuraavista syistä:
- hakukonepakotteet verkkosivustoa vastaan;
- virheiden esiintyminen sivustolla;
- hakukonealgoritmien muuttaminen;
- iljettävä isännöinti (projektin sijaintipalvelimen saavuttamattomuus) ja niin edelleen.
Yandexin vastauksia yleisiin kysymyksiin
"Yandex" on monien käyttäjien käyttämä hakukone. Se on maailman hakujärjestelmien joukossa viidenneksi käsiteltyjen tutkimuspyyntöjen määrässä. Jos lisäsit sivuston siihen, sen lisääminen tietokantaan voi kestää liian kauan.
URL-osoitteen lisääminen ei takaa sen indeksointia. Tämä on vain yksi menetelmistä, joilla järjestelmärobotille kerrotaanuudesta resurssista. Jos sivustossa on vähän tai ei ollenkaan linkkejä muilta sivustoilta, sen lisääminen auttaa sinua löytämään sen nopeammin.
Jos indeksointia ei tapahtunut, sinun on tarkistettava, oliko palvelimessa virheitä, kun luot sille sovelluksen Yandex-robotista. Jos palvelin ilmoittaa virheestä, robotti lopettaa työnsä ja yrittää suorittaa sen loppuun meno-paluujärjestyksessä. Yandexin työntekijät eivät voi nopeuttaa sivujen lisäämistä hakukoneen tietokantaan.
Sivuston indeksointi Yandexissa on melko vaikea tehtävä. Etkö tiedä kuinka lisätä resurssia hakukoneeseen? Jos siihen on linkkejä muilta verkkosivustoilta, sinun ei tarvitse lisätä erityistä sivustoa - robotti löytää sen automaattisesti ja indeksoi sen. Jos sinulla ei ole tällaisia linkkejä, voit käyttää "Lisää URL-osoite" -lomaketta kertoaksesi hakukoneelle, että sivusto on olemassa.
Muista, että URL-osoitteen lisääminen ei takaa, että luomuksesi indeksoidaan (tai indeksoidaan).
Monet ihmiset ihmettelevät, kuinka kauan sivuston indeksointi Yandexissä kestää. Tämän yrityksen työntekijät eivät anna takuita eivätkä ennusta ehtoja. Koska robotti sai tietää sivustosta, sen sivut tulevat hakuun yleensä kahdessa päivässä, joskus parissa viikossa.
Käsittely
"Yandex" on hakukone, joka vaatii tarkkuutta ja huomiota. Sivuston indeksointi koostuu kolmesta osasta:
- Hakurobotti indeksoi resurssisivuja.
- Sisältösivuston (sisältö) tallennetaan hakujärjestelmän tietokantaan (hakemistoon).
- 2-4 viikon kuluttua tietokannan päivityksen jälkeen voit nähdä tulokset. Sivustosi näkyy (tai ei) näy hakutuloksissa.
Indeksoinnin tarkistus
Kuinka tarkistaa verkkosivuston indeksointi? Voit tehdä tämän kolmella tavalla:
- Kirjoita yrityksesi nimi hakupalkkiin (esimerkiksi "Yandex") ja tarkista kaikki linkit ensimmäisellä ja toisella sivulla. Jos löydät sieltä aivolapsesi URL-osoitteen, robotti on suorittanut tehtävänsä.
- Voit kirjoittaa verkkosivustosi URL-osoitteen hakupalkkiin. Näet kuinka monta Internet-arkkia näytetään, eli indeksoituna.
- Rekisteröidy Mail.ru:n, Googlen, Yandexin verkkovastaavien sivuilla. Kun olet läpäissyt sivuston vahvistuksen, voit nähdä indeksointitulokset ja muut hakukonepalvelut, jotka on luotu parantamaan resurssi suorituskykyä.
Miksi Yandex epäonnistuu?
Sivuston indeksointi Googlessa tapahtuu seuraavasti: robotti syöttää tietokantaan kaikki sivuston sivut, huonolaatuiset ja korkealaatuiset, ilman valintaa. Mutta vain hyödylliset asiakirjat sisältyvät sijoitukseen. Ja "Yandex" sulkee välittömästi pois kaikki verkkoroskakorit. Se voi indeksoida minkä tahansa sivun, mutta hakukone poistaa lopulta kaiken roskat.
Molemmissa järjestelmissä on inkrementaalinen indeksi. Molemmat huonolaatuiset sivut vaikuttavat koko web-sivuston sijoitukseen. Täällä toimii yksinkertainen filosofia. Tietyn henkilön suosikkiresurssitkäyttäjällä on korkeammat asemat liikkeeseenlaskussaan. Mutta tämän saman henkilön on vaikea löytää sivustoa, josta hän ei pitänyt viime kerralla.
Siksi on ensinnäkin tarpeen peittää verkkodokumenttien kopiot indeksoinnista, tarkistaa tyhjiä sivuja ja estää heikkolaatuisen sisällön indeksointi.
Nopeuta Yandex
Kuinka voin nopeuttaa sivuston indeksointia Yandexissä? Noudata näitä ohjeita:
- Asenna Yandex-selain tietokoneellesi ja käytä sitä sivuston sivujen selaamiseen.
- Vahvista resurssin hallintaoikeudet Yandex. Webmasterissa.
- Lähetä linkki artikkeliin Twitterissä. Tiedetään, että Yandex on tehnyt yhteistyötä tämän yrityksen kanssa vuodesta 2012.
- Lisää sivuston haku Yandexistä. "Indeksointi"-osioon voit kirjoittaa omat URL-osoitteesi.
- Syötä "Yandex. Metrica"-koodi merkitsemättä "Sivujen lähettäminen indeksoitavaksi on kielletty".
- Tuo sivustokartta, joka on olemassa vain robotille ja joka ei näy yleisölle. Varmistus alkaa hänestä. Sivustokartan osoite kirjoitetaan robots.txt-tiedostoon tai sopivassa muodossa kohtaan "Webmaster" - "Indeksointiasetukset" - "Sivustokarttatiedostot".
Välitoimenpiteet
Mitä on tehtävä, kunnes Yandex on indeksoinut verkkosivun? Kotimaisen hakukoneen tulisi pitää sivustoa ensisijaisena lähteenä. Tästä syystä jo ennen artikkelin julkaisua on välttämätöntä lisätä sen sisältö muotoon "Erityiset tekstit". Muutenplagioijat kopioivat tietueen resursseihinsa ja ovat ensimmäisiä tietokannassa. Tämän seurauksena heidät tunnistetaan tekijöiksi.
Google-tietokanta
Googlelle sopivat samat suositukset kuin yllä kuvasimme, vain palvelut ovat erilaisia:
- Google+ (korvaa Twitterin);
- Google Chrome;
- Google-työkalut ohjelmoijille - "Skannaus" - "Näyttää Googlebotilta" - vaihtoehto "Skannaus" - vaihtoehto "Hakemisto";
- hae Googlen resurssista;
- Google Analytics (Yandex. Metricsin sijaan).
Kielto
Mikä on sivuston indeksointikielto? Voit peittää sen sekä koko sivun että sen erillisen osan (linkin tai tekstin) päälle. Itse asiassa on olemassa sekä globaali indeksointikielto että paikallinen. Kuinka se toteutetaan?
Mietitään kieltoa lisätä web-sivustoa Robots.txt-tiedoston hakukonetietokantaan. Robots.txt-tiedoston avulla voit sulkea pois yhden sivun tai koko resurssiotsikon indeksoinnin seuraavasti:
- User-agent:
- Disallow: /kolobok.html
- Disallow: /foto/
Ensimmäinen kohta sanoo, että ohjeet on määritelty kaikille PS:ille, toinen osoittaa, että kolobok.html-tiedoston indeksointi on kiellettyä ja kolmas ei salli koko fotokansion täytön lisäämistä tietokanta. Jos haluat sulkea pois useita sivuja tai kansioita, määritä ne kaikki Robots-kohdassa.
Jos haluat estää tietyn Internet-arkin indeksoinnin, voit käyttää robots-sisällönkuvauskenttää. Se eroaa robots.txt-tiedostostase, että se antaa ohjeet kaikille PS:lle kerralla. Tämä sisällönkuvauskenttä noudattaa html-muodon yleisiä periaatteita. Se tulee sijoittaa sivun otsikkoon tunnisteiden väliin. Esimerkiksi kieltomerkintä voidaan kirjoittaa näin:.
Ajax
Miten Yandex indeksoi Ajax-sivustot? Nykyään monet web-sivustojen kehittäjät käyttävät Ajax-tekniikkaa. Tietysti hänellä on suuri potentiaali. Sen avulla voit luoda nopeita ja tuottavia interaktiivisia verkkosivuja.
Hakukonerobotti "näkee" verkkoluettelon kuitenkin eri tavalla kuin käyttäjä ja selain. Esimerkiksi henkilö katselee mukavaa käyttöliittymää siirrettävästi ladattujen Internet-arkkien kanssa. Indeksointirobotille saman sivun sisältö voi olla tyhjä tai se voidaan esittää muuna staattisena HTML-sisältönä, jonka skriptit eivät toimi.
Voit käyttää URL-osoitetta, jossa onAjax-sivustojen luomiseen, mutta hakukone ei käytä sitä. Yleensä -merkin jälkeen oleva URL-osoitteen osa erotetaan. Tämä on otettava huomioon. Siksi URL-osoitteen, kuten https://site.ru/example, sijasta hän tekee sovelluksen osoitteessa https://site.ru sijaitsevan resurssin pääsivulle. Tämä tarkoittaa, että Internet-sivun sisältö ei välttämättä pääse tietokantaan. Tämän seurauksena se ei näy hakutuloksissa.
Ajax-sivustojen indeksoinnin parantamiseksi Yandex tuki hakurobotin muutoksia ja tällaisten web-sivustojen URL-osoitteiden käsittelyä koskevia sääntöjä. Nykyään verkkovastaavat voivat ilmoittaa Yandex-hakukoneelle indeksoinnin tarpeen luomalla sopivan järjestelmän resurssirakenteeseen. Tätä varten tarvitset:
- Korvaa symbolisivujen URL-osoitteissapaikassa !. Nyt robotti ymmärtää, että se voi hakea tämän Internet-sivun sisällön HTML-versiota.
- HTML-versio tällaisen sivun sisällöstä tulee sijoittaa URL-osoitteeseen, jossa ! korvattu ?_escaped_fragment_=.