Otsingumootorid nagu Google on osa sellest, mis muudab Interneti nii võimsaks. Mõne klahvivajutuse ja ühe nupuvajutusega kuvatakse teie küsimusele kõige asjakohasemad vastused. Kuid kas olete kunagi mõelnud, kuidas otsingumootorid töötavad? Veebirohud on osa vastusest.

Niisiis, mis on veebirobot ja kuidas see töötab?

Mis on veebirobot?

Pixabay - omistamist pole vaja

Kui otsite otsingumootorist midagi, peab mootor kõige asjakohasemate tulemuste kuvamiseks kiiresti skannima miljoneid (või miljardeid) veebilehti. Veebirändurid (tuntud ka kui ämblikud või otsingumootori robotid) on automatiseeritud programmid, mis indekseerivad Internetti ja koondavad veebilehtede kohta teavet hõlpsasti juurdepääsetaval viisil.

Sõna „indekseerimine” viitab sellele, kuidas veebirändurid internetti läbivad. Veebironijaid nimetatakse ka ämblikeks. See nimi tuleneb sellest, kuidas nad veebis roomavad - näiteks kuidas ämblikud oma ämblikuvõrkudel roomavad.

Veebirändurid hindavad ja koostavad andmeid võimalikult paljude veebilehtede kohta. Nad teevad seda nii, et andmed oleksid hõlpsasti kättesaadavad ja otsitavad, mistõttu on need otsingumootoritele nii olulised.

Mõelge veebirobotile kui toimetajale, kes koostab raamatu lõpus oleva indeksi. Indeksi ülesanne on teavitada lugejat, kus raamatus iga võtmeteema või fraas esineb. Samamoodi loob veebirobal indeksi, mida otsingumootor kasutab otsingupäringu kohta kiire teabe leidmiseks.

Mis on otsingu indekseerimine?

Nagu oleme maininud, on otsingute indekseerimine võrreldav raamatu tagaküljel oleva indeksi koostamisega. Mõnes mõttes on otsingu indekseerimine nagu lihtsustatud Interneti -kaardi loomine. Kui keegi esitab otsingumootorile küsimuse, käivitab otsingumootor selle indeksi ja kõigepealt kuvatakse kõige asjakohasemad lehed.

Aga kuidas otsingumootor teab, millised lehed on asjakohased?

Otsingu indekseerimine keskendub peamiselt kahele asjale: lehe tekst ja lehe metaandmed. Tekst on kõik, mida lugejana näete, samas kui metaandmed on teave lehe looja sisestatud teabe kohta, tuntud kui "metasildid". Metasildid sisaldavad selliseid asju nagu lehe kirjeldus ja meta pealkiri, mis kuvatakse otsingus tulemused.

Otsingumootorid, nagu Google, indekseerivad kogu veebilehe teksti (välja arvatud teatud sõnad, näiteks „a” ja „a”). Kui otsinguterminist otsitakse terminit, otsib see kiiresti kõige asjakohasema lehe indeksit.

Kuidas veebirobot töötab?

Pixabay - omistamist pole vaja

Veebirobot töötab nagu nimigi ütleb. Need algavad teadaolevalt veebilehelt või URL -ilt ja indekseerivad iga selle lehe URL -i (enamasti nõuavad veebisaitide omanikud otsingumootorid teatud URL -ide indekseerimiseks). Kui neil lehtedel on hüperlingid, siis koostavad nad ülesannete loendi lehtedest, mida nad järgmisena indekseerivad. Veebirobot jätkab seda määramata aja jooksul, järgides konkreetseid reegleid selle kohta, milliseid lehti indekseerida ja milliseid ignoreerida.

Veebirändurid ei indekseeri kõiki Interneti lehti. Tegelikult on hinnanguliselt ainult 40–70% Internetist otsinguindekseeritud (mis on endiselt miljardeid lehti). Paljud veebirobotid on loodud keskenduma lehtedele, mida peetakse autoriteetsemaks. Autoriteetne lehed vastavad käputäiele kriteeriumidele, mis muudavad need tõenäolisemalt kvaliteetseks või populaarseks teavet. Veebirobotid peavad ka lehti uuendamise, eemaldamise või teisaldamise ajal järjepidevalt uuesti külastama.

Viimane tegur, mis kontrollib, milliseid lehti veebirobal indekseerib, on protokoll robots.txt või robotite välistamise protokoll. Veebilehe server võõrustab faili robots.txt, mis sätestab reeglid igale lehele juurdepääsvale veebirobotile või muudele programmidele. Fail välistab teatud lehtede indekseerimise ja linkide, mida roomik saab jälgida. Faili robots.txt üks eesmärk on piirata robotite koormust veebisaidi serverile.

Veebirobotil teie veebisaidi teatud lehtedele juurdepääsu takistamiseks saate märgendi „keelata” lisada saidi kaudu fail robots.txt või lisage noindex meta märgend kõnealusele lehele.

Mis vahe on roomamisel ja kraapimisel?

Veebi kraapimine on robotite kasutamine veebisaidilt andmete allalaadimiseks ilma selle veebisaidi loata. Sageli kasutatakse veebi kraapimist pahatahtlikel põhjustel. Veebi kraapimine võtab sageli kogu HTML -koodi kindlatelt veebisaitidelt ja arenenumad kaabitsad võtavad ka CSS -i ja JavaScripti elemendid. Veebi kraapimise tööriistad saab kasutada konkreetsete teemade (nt tootenimekiri) kohta teabe kiireks ja hõlpsaks koostamiseks, kuid võib ka eksida hallid ja ebaseaduslikud territooriumid.

Veebi indekseerimine seevastu on teabe indekseerimine veebisaitidel loaga, et need saaksid otsingumootorites hõlpsasti ilmuda.

Veebironija näited

Igal suuremal otsingumootoril on üks või mitu veebirobotit. Näiteks:

  • Google'il on Googlebot
  • Bingil on Bingbot
  • DuckDuckGol on DuckDuckBot.

Suurematel otsingumootoritel, nagu Google, on eri fookuste jaoks spetsiaalsed robotid, sealhulgas Googlebot Images, Googlebot Videos ja AdsBot.

Kuidas veebi indekseerimine SEO -d mõjutab?

Pixabay - omistamist pole vaja

Kui soovite, et teie leht ilmuks otsingumootori tulemustes, peab leht olema veebirobotitele juurdepääsetav. Sõltuvalt teie veebisaidi serverist võite soovida määrata konkreetse indekseerimise sageduse, millised lehed indekseerijale skannida ja kui palju nad võivad teie serverile survet avaldada.

Põhimõtteliselt soovite, et veebipõhised indekseerijad sisendaksid sisu täis lehti, kuid mitte selliseid lehti nagu tänusõnumid, administraatori lehed ja sisemised otsingutulemused.

Teave käeulatuses

Otsingumootorite kasutamine on enamiku jaoks muutunud teiseks loomuseks, kuid enamikul meist pole aimugi, kuidas need toimivad. Veebirändurid on tõhusa otsingumootori üks peamisi osi ja indekseerivad iga päev tõhusalt teavet miljonite oluliste veebisaitide kohta. Need on hindamatu tööriist nii veebisaitide omanikele, külastajatele kui ka otsingumootoritele.

JagaPiiksumaE -post
Programmeerimine vs. Veebiarendus: mis vahe on?

Võib arvata, et rakenduste programmeerijad ja veebiarendajad teevad sama tööd, kuid see pole kaugeltki tõde. Siin on peamised erinevused programmeerijate ja veebiarendajate vahel.

Loe edasi

Seotud teemad
  • Tehnoloogia selgitatud
  • Veebiotsing
  • Google otsing
  • Otsingu nipid
Autori kohta
Jake Harfield (Avaldatud 25 artiklit)

Jake Harfield on vabakutseline kirjanik, kes asub Austraalias Perthis. Kui ta ei kirjuta, on ta tavaliselt väljas põõsas ja pildistab kohalikku elusloodust. Saate teda külastada aadressil www.jakeharfield.com

Veel Jake Harfieldilt

Telli meie uudiskiri

Liituge meie uudiskirjaga, et saada tehnilisi näpunäiteid, ülevaateid, tasuta e -raamatuid ja eksklusiivseid pakkumisi!

Tellimiseks klõpsake siin