Co je webový prohledávač/pavouk a jak funguje?

Vyhledávače jako Google jsou součástí toho, co dělá internet tak silným. Po několika stisku kláves a kliknutí na tlačítko se zobrazí nejrelevantnější odpovědi na vaši otázku. Ale přemýšleli jste někdy o tom, jak fungují vyhledávače? Webové prohledávače jsou součástí odpovědi.

Co je tedy webový prohledávací modul a jak funguje?

Co je webový prohledávací modul?

Pixabay - není vyžadováno žádné uvedení zdroje

Když hledáte něco ve vyhledávači, musí motor rychle naskenovat miliony (nebo miliardy) webových stránek, aby zobrazil nejrelevantnější výsledky. Webové prohledávače (známé také jako pavouci nebo roboti vyhledávačů) jsou automatizované programy, které „procházejí“ internet a shromažďují informace o webových stránkách snadno přístupným způsobem.

Slovo „procházení“ označuje způsob, jakým prohledávače procházejí internet. Webové prohledávače jsou také známé jako „pavouci“. Toto jméno pochází ze způsobu, jakým procházejí web - jako když pavouci lezou po jejich pavučinách.

Prohledávače webu vyhodnocují a kompilují data na co největším počtu webových stránek. Dělají to proto, aby data byla snadno dostupná a prohledávatelná, a proto jsou pro vyhledávače tak důležitá.

instagram viewer

Představte si webový prohledávač jako editora, který sestavuje rejstřík na konci knihy. Úkolem rejstříku je informovat čtenáře, kde se v knize objevuje každé klíčové téma nebo fráze. Podobně webový prolézací modul vytvoří index, který vyhledávací stroj používá k rychlému nalezení relevantních informací o vyhledávacím dotazu.

Co je indexování vyhledávání?

Jak jsme zmínili, indexování vyhledávání je srovnatelné se sestavováním indexu na zadní straně knihy. Indexování vyhledávání je svým způsobem jako vytváření zjednodušené mapy internetu. Když někdo položí vyhledávači otázku, vyhledávač jej provede prostřednictvím svého indexu a jako první se zobrazí nejrelevantnější stránky.

Jak ale vyhledávač pozná, které stránky jsou relevantní?

Indexování vyhledávání se primárně zaměřuje na dvě věci: text na stránce a metadata stránky. Text je vše, co vidíte jako čtenář, zatímco metadata jsou informace o vstupu stránky tvůrcem stránky, známé jako „meta tagy“. Meta tagy obsahují věci jako popis stránky a meta název, které se objevují ve vyhledávání Výsledek.

Vyhledávače, jako je Google, budou indexovat veškerý text na webové stránce (kromě určitých slov jako „“ a „a“ v některých případech). Když je výraz vyhledán ve vyhledávači, rychle prohledá jeho index pro nejrelevantnější stránku.

Jak funguje webový prohledávač?

Pixabay - není vyžadováno žádné uvedení zdroje

Webový prohledávač funguje, jak naznačuje název. Začínají na známé webové stránce nebo adrese URL a indexují každou stránku na této adrese URL (majitelé webových stránek většinou požadují, aby vyhledávače prohledávaly konkrétní adresy URL). Jakmile na těchto stránkách narazí na hypertextové odkazy, sestaví seznam úkolů, které budou dále procházet. Prohledávač webu v tom bude pokračovat po neomezenou dobu, přičemž bude dodržovat konkrétní pravidla o tom, které stránky procházet a které ignorovat.

Prohledávače webu neprocházejí každou stránku na internetu. Ve skutečnosti se odhaduje, že bylo indexováno pouze 40–70% internetu (což jsou stále miliardy stránek). Mnoho webových prohledávačů je navrženo tak, aby se zaměřovaly na stránky, které jsou považovány za „autoritativnější“. Autoritativní stránky splňují několik kritérií, díky nimž je větší pravděpodobnost, že budou obsahovat vysoce kvalitní nebo populární informace. Webové prolézací moduly musí také pravidelně aktualizovat, odstraňovat nebo přesouvat stránky.

Posledním faktorem, který určuje, které stránky bude webový prolézací modul procházet, je protokol robots.txt nebo protokol pro vyloučení robotů. Server webové stránky bude hostovat soubor robots.txt, který stanoví pravidla pro jakýkoli webový prohledávač nebo jiné programy přistupující ke stránce. Soubor vyloučí procházení konkrétních stránek a odkazy, které může prolézací modul sledovat. Jedním z cílů souboru robots.txt je omezit zátěž, kterou roboti kladou na server webové stránky.

Chcete -li zabránit webovému prohledávači v přístupu na určité stránky vašeho webu, můžete přidat značku „zakázat“ prostřednictvím soubor robots.txt nebo přidat noindex meta tag na dotyčnou stránku.

Jaký je rozdíl mezi procházením a škrábáním?

Škrábání webu je použití robotů ke stahování dat z webu bez svolení tohoto webu. Škrábání webu se často používá ze škodlivých důvodů. Webové škrábání často bere veškerý kód HTML z konkrétních webových stránek a pokročilejší škrabky také převezmou prvky CSS a JavaScript. Nástroje pro škrábání webu lze použít k rychlému a snadnému sestavení informací o konkrétních tématech (řekněme seznam produktů), ale také se do něj můžete vloudit šedá a nelegální území.

Procházení webu je naopak indexování informací na webových stránkách se svolením, aby se mohly snadno objevit ve vyhledávačích.

Příklady webového prohledávače

Každý hlavní vyhledávač má jeden nebo více webových prohledávačů. Například:

Google má Googlebot
Bing má Bingbot
DuckDuckGo má DuckDuckBot.

Větší vyhledávače, jako je Google, mají specifické roboty pro různé zaměření, včetně obrázků Googlebot, videí Googlebot a AdsBot.

Jak procházení webu ovlivňuje SEO?

Pixabay - není vyžadováno žádné uvedení zdroje

Pokud chcete, aby se vaše stránka zobrazovala ve výsledcích vyhledávače, musí být přístupná prohledávačům webu. V závislosti na serveru vašeho webu možná budete chtít přidělit konkrétní frekvenci procházení, které stránky má prohledávač skenovat a jaký tlak na váš server mohou vyvíjet.

V zásadě chcete, aby se prohledávače webu zaměřovaly na stránky plné obsahu, ale nikoli na stránky jako zprávy s poděkováním, stránky pro správce a interní výsledky vyhledávání.

Informace na dosah ruky

Používání vyhledávačů se pro většinu z nás stalo druhou přirozeností, přesto většina z nás netuší, jak fungují. Webové prohledávače jsou jednou z hlavních součástí efektivního vyhledávače a každý den efektivně indexují informace o milionech důležitých webových stránek. Jsou neocenitelným nástrojem pro majitele webových stránek, návštěvníky i vyhledávače.

PodíltweetE-mailem

Programování vs. Vývoj webu: Jaký je rozdíl?

Můžete si myslet, že programátoři aplikací a weboví vývojáři dělají stejnou práci, ale to není zdaleka pravda. Zde jsou klíčové rozdíly mezi programátory a webovými vývojáři.

Číst dále

Související témata

Technologie vysvětlena
Webové vyhledávání
Google vyhledávání
Hledat triky

O autorovi

Jake Harfield (25 článků zveřejněno)

Jake Harfield je nezávislý spisovatel se sídlem v australském Perthu. Když nepíše, obvykle je venku v křoví a fotografuje místní divokou zvěř. Můžete ho navštívit na www.jakeharfield.com

Více od Jakea Harfielda

Přihlaste se k odběru našeho zpravodaje

Připojte se k našemu zpravodaji a získejte technické tipy, recenze, bezplatné elektronické knihy a exkluzivní nabídky!

Kliknutím sem se přihlásíte k odběru

About Technology - denizatm.com

Co je webový prohledávač/pavouk a jak funguje?

Co je webový prohledávací modul?

Co je indexování vyhledávání?

Jak funguje webový prohledávač?

Jaký je rozdíl mezi procházením a škrábáním?

Příklady webového prohledávače

Jak procházení webu ovlivňuje SEO?

Informace na dosah ruky

Přihlaste se k odběru našeho zpravodaje

kategorie

Recent Post

Danny Stieben, Author ve společnosti MakeUseOf

Přesně jak populární jsou právě podcasty?

8 receptů iPhone IFTTT, bez kterých nemůžete žít