Fljótleg leiðarvísir til að skrifa Robots.txt skrá

Hvernig á að skoða risastóra kennslubók? Sigtið í gegnum vísitöluna. Jæja: það er einn þáttur sem er raunveruleg samantekt á vefsíðunni þinni ...

Robots.txt: Forritunarkóðar verða áreiðanlega flóknari og flóknari
Forritunarkóðar eiga að verða sífellt flóknari

Eina leiðin til að komast í samband við leitarvélarkóngulóinn, eða skrúfjárn, er í gegnum skrá sem heitir robots.txt. Eða betra. Þegar þú sendir vefsíðutillögu þína til Google stendur hún frammi fyrir einfaldlega gríðarlegu magni upplýsinga.

Hvernig geturðu leitað í kennslubók sem er svo stór að þér finnst þú aldrei finna allt sem þú þarft? Þú hefur samráð vísitölunni. Jæja: robots.txt skráin er vísitala vefsíðunnar þinnar.

Þetta er skjal sem auðvelt er að fylla út sem segir leitarvélarskriðnum hverju hann á að leita að. Í stuttu máli: þú munt hjálpa honum að skilja úr hverju vefsíðan þín er gerð, svo að reikniritið geti gefið þér röðun sem er í samræmi við vinnuna sem þú hefur unnið.

Getur einhver skrifað robots.txt skrá?

Stutta svarið er já. Heiðarlega svarið er nei. Þó að málfræði robots.txt skráar sé afar einföld og samsetning hennar samanstendur af nokkrum línum, er betra að treysta á umönnun sérfróðs vefstjóra sem veit hvar á að leggja hendur sínar. Þegar öllu er á botninn hvolft eru lítil mistök nóg til að skerða staðsetningu vefsíðunnar þinnar og því stöðva allar SEO aðgerðir áður en byrjað er.

Áður en þú byrjar skaltu vita eitt: hver sem er getur skoðað robots.txt skrána á hvaða síðu sem er með því að skrifa /robots.txt aftan við lénið. Þú getur jafnvel ráðfært þig við Google!

Þú getur skrifað slíka skrá án þess að hlaða niður sérstökum hugbúnaði. Reyndar er nóg að nota skrifblokkina og vista, gettu hvað, á .txt sniði.

Við skulum skrifa saman robots.txt: hausinn

Byrjum á byrjuninni, eins og það er alltaf rökrétt að gera. Opnun skráarinnar, eða öllu heldur hausinn, er alfarið tileinkuð nafni kóngulóarinnar, á undan er lítið orðalag sem er alltaf það sama. Gerum ráð fyrir að þú viljir láta Google taka eftir þér. Svo fyrsta línan verður:

Umboðsmaður notenda: Googlebot

Þessi mjög stutti strengur segir Google að allt sem á eftir kemur mun vissulega vekja áhuga hennar. Ef þú vilt að allir skriðlarar sem lesa þessa tegund skráa geti skoðað skjalið skaltu setja Googlebot í staðinn fyrir einfaldan *, a stjörnu.

Nú þegar þú hefur tilgreint hvaða könguló, þ.e. HVERNIG, þarftu að tilgreina líka HVAÐ hann verður að lesa.

Hver lína af kóða, samkvæmt skilgreiningu, samsvarar aðgerð vélarinnar. Það segir sig sjálft að hver skipun í robots.txt skránni samsvarar því sem vélin á ekki að gera. Og þetta er lykillinn sem gerir þér kleift að skrifa mjög áhrifaríkt. Við erum að tala um DISALLOW skipunina.

Hvað er DISALLOW skipunin?

Il banna skipun gerir þér kleift að rökræða með útilokun. Með öðrum orðum, þegar sagt er að það sé fyrst til að segja hvað ætti ekki að gera - jæja, þú ert að rökræða með útilokun. Til viðbótar við bannið er einnig leyfið, sem er undantekningin frá blokkinni.

Ef þú vilt skrifa góða vélmennaskrá þarftu að hugsa á hinn veginn, svo þú verður að segja Google hvað það ætti ekki að lesa. Ef þú skrifar:

Ekki leyfa:

Köngulóin mun lesa alla síðuna þína, án bremsa.

Ef þú setur inn skástrik á eftir „Disallow:“ (þess vegna Disallow: /), verður vefsíðan ekki færð inn í leitarvélar, punktur.

Ekki leyfa: /möppur/

Skiptu um orðaskrá fyrir möppuna sem þú vilt að verði hafnað frá köngulóarsýn. Þú getur gert það sama með tiltekinni skrá.

Disallow: /myfile.html

Athygli til greinarmerkjum og bókstöfum, hástafir eða lágstafir. Þessi tegund af skrám hefur svona "smá" ​​í hávegum, en þeir skipta miklu.

Af hverju myndirðu hindra Google í að lesa stóran hluta af síðunni þinni? Þegar þú skrifar skrá af þessari gerð er mikilvægt að skilja hvaða skrár ættu ekki að birtast á leitarvélinni, en án þess að misnota þær. Hins vegar skaltu vita að allir sem vita nákvæmlega heimilisfang þessarar tilteknu skráar munu geta nálgast hana í öllum tilvikum.

Hvað er ALLOW skipunin?

Í skránni geturðu bætt við undantekningu með skipuninni LÁTT. Málfræðin er eins, en hún mun skapa nokkrar undantekningar frá DISALLOW sem gerir kleift að opna áhugaverðar könnunarmörk fyrir köngulóna.

Lítil sýnishornsskrá:

Umboðsmaður notenda: Googlebot

Ekki leyfa: /myndir/

Leyfa: /images/holidays.jpg

Í grundvallaratriðum sögðum við Googlebot að huga ekki að myndamöppunni, nema tiltekna mynd inni í henni, nefnilega þeirri frá hátíðunum.

Og það, krakkar, er það. Við skrifuðum fyrstu robots.txt skrána okkar. Jú, það sem við ætlum að gera fyrir raunverulega síðuna gæti verið aðeins öðruvísi, en ekki mikið. Ef þú ert í vafa skaltu alltaf fá ráðleggingar frá sérhæfðum vefstjóra. Við ráðleggjum þér að reyna að skrifa það sjálfur, fyrst og fremst, og senda honum það til skoðunar, til að ná tökum á grunnatriðum og skilja betur hvernig vefsíðan þín virkar.

Hver er fylgnin á milli robots.txt og vefkorta?

Veftréð er skrá sem er búin til með sérstökum viðbótum sem inniheldur alla tengla á síðunni. Þegar köngulóin kemur inn á síðuna les hún fyrst vélmennin og skríður síðan síðuna. Ef vélmenni finnur veffang vefkortsins meðan á skriðinu stendur, verður allt ferlið miklu auðveldara.

Bættu eftirfarandi við ofangreindan kóða:

Veftré: http://www.ilnomedeltuositobellissimo.com/sitemap.xml

Að lokum

Allar vélmennaskrár eru þær sömu. Þetta þýðir að Robots skrá skrifuð fyrir Google mun líka virka fínt fyrir Bing og fylgja sömu málfræði.

Vel skipulögð robots.txt skrá gerir þér kleift að sparar skriðtíma. Ekki láta hugfallast: þetta er fyrsta skrefið í átt að árangri!

Robots.txt: Google er öflugasta leitarvélin á netinu
Google er öflugasta leitarvélin á netinu