Principal Afaceri Online Ce este un Spider Spider?

Ce este un Spider Spider?

Horoscopul Tău Pentru Mâine

Un „software spider” este un program fără pilot operat de un motor de căutare care navighează pe Web la fel ca dvs. Pe măsură ce vizitează fiecare site Web, înregistrează (salvează pe hard diskul său) toate cuvintele de pe fiecare site și notează fiecare link către alte site-uri. Apoi „face clic” pe un link, iar pe acesta merge să citească, să indexeze și să stocheze un alt site Web.

cu care este căsătorit cu Josh elliott

Software-ul Spider citește adesea și apoi indexează întregul text al fiecărui site web pe care îl accesează în baza de date principală a motorului de căutare pentru care lucrează. Recent, multe motoare precum AltaVista au început să indexeze doar până la un anumit număr de pagini ale unui site, adesea aproximativ 500 în total, și apoi să se oprească. Aparent, acest lucru se datorează faptului că Web-ul a devenit atât de mare încât este imposibil de indexat totul. Câte pagini va indexa păianjenul nu este complet previzibil. Prin urmare, este o idee bună să trimiteți în mod specific fiecare pagină importantă de pe site-ul dvs. pe care doriți să o indexați, cum ar fi cele care conțin cuvinte cheie importante.

Un păianjen software este ca un bibliotecar electronic care decupează cuprinsul fiecărei cărți din fiecare bibliotecă din lume, le sortează într-un gigantic index master și apoi construiește o bibliografie electronică care stochează informații despre ce texte fac referire la alte texte. Unii păianjeni software pot indexa mai mult de un milion de documente pe zi! Este important să înțelegem că păianjenii motoarelor de căutare fac doar două lucruri:

  • Acestea indexează textul.
  • Urmează link-uri.

La o conferință recentă Search Engine Strategies susținută de SearchEngineWatch.com, unul dintre vorbitorii invitați, Shari Thurow de la Grantastic Designs, a subliniat acest lucru și l-a repetat de mai multe ori pentru a ilustra semnificația acestuia: „Motoarele de căutare indexează textul și urmează linkurile. Acestea indexează text și urmează link-uri. Asta e tot ce fac.

Punctul ei este important și central pentru înțelegerea naturii păianjenilor motoarelor de căutare. Dacă textul site-ului dvs. web este conținut într-un grafic, motoarele de căutare nu îl pot indexa. Dacă toate cuvintele cheie importante pentru care sperați să obțineți clasamente sunt incluse în grafică, nu în textul HTML, site-ul dvs. nu va atinge clasamente. Amintiți-vă, motoarele de căutare nu indexează imagini sau citesc imagini, indexează text și urmează linkuri. Asta e tot. Dacă nu aveți text pe pagina dvs. vizibilă, nicio cantitate de cuvinte cheie din metatagul cuvintelor cheie nu vă va ajuta să obțineți clasamente.

Ceea ce vede păianjenul pe site-ul dvs. va determina modul în care site-ul dvs. este listat în indexul său. Motoarele de căutare determină relevanța unui site pe baza unui sistem complex de notare pe care motoarele de căutare încearcă să îl păstreze secret. Acest sistem adaugă sau scade puncte pe baza unor lucruri precum câte ori a apărut cuvântul cheie pe pagină, unde a apărut pe pagină și câte cuvinte au fost găsite. Paginile care obțin cele mai multe puncte sunt returnate în partea de sus a rezultatelor căutării; restul sunt îngropate în partea de jos, care nu se regăsesc niciodată.

Pe măsură ce un păianjen software vă vizitează site-ul, acesta notează orice legături de pe pagina dvs. către alte site-uri. În vasta bază de date a oricărui motor de căutare sunt înregistrate toate legăturile dintre site-uri. Motorul de căutare știe la ce site-uri v-ați conectat și, mai important, pe care dintre ele v-ați conectat. Multe motoare vor folosi chiar numărul de link-uri către site-ul dvs. ca indiciu al popularității și vor crește clasamentul pe baza acestui factor.

lydia hewitt-lee tom cassell

Drepturi de autor © 2000 iProspect.com