reklama
Jste věřící v myšlenku, že jakmile bude něco zveřejněno na internetu, bude publikováno navždy? Dnes se chystáme rozptýlit tento mýtus.
Pravda je, že v mnoha případech je možné vymýtit informace z internetu. Jistě, existuje záznam webových stránek, které byly odstraněny, pokud prohledáváte Wayback Machine, že jo? Jasně. Na Wayback Machine jsou záznamy o webových stránkách, které se vracejí již mnoho let - stránky, které nenajdete pomocí vyhledávání Google, protože webová stránka již neexistuje. Někdo to smazal, nebo se web vypnul.
Takže se to nedá obejít, že? Informace budou navždy vyryty do kamene internetu, budou tam vidět generace? No, ne přesně.
Pravda je, že i když může být obtížné nebo nemožné vymazat hlavní zpravodajské příběhy, které se rozšířily z jednoho zpravodajského webu nebo blogu na jiný, jako je virus, ve skutečnosti je docela snadné zcela vymazat webovou stránku nebo několik webových stránek ze všech záznamů o existenci - tuto stránku odstranit jak pro vyhledávače, tak pro
Wayback Machine Nový stroj Wayback umožňuje vizuální cestování zpět v internetovém časeZdá se, že od spuštění Wayback Machine v roce 2001 se majitelé stránek rozhodli vyhodit back-end založený na Alexě a přepracovat jej s vlastním otevřeným zdrojovým kódem. Po provedení zkoušek s ... Přečtěte si více . Je tu samozřejmě háček, ale dostaneme se k tomu.3 způsoby, jak odebrat blogové stránky ze sítě
První metoda je ta, kterou většina majitelů webových stránek používá, protože neví nic lepšího - jednoduše smazat webové stránky. K tomu může dojít, protože jste si uvědomili, že na svém webu máte duplicitní obsah, nebo protože máte stránku, kterou se nechcete ve výsledcích vyhledávání zobrazovat.
Jednoduše smažte stránku
Problém s úplným odstraněním stránek z vašeho webu je ten, že jste již stránku založili na internetu net, budou pravděpodobně existovat odkazy z vašich vlastních stránek i externí odkazy z jiných webů na konkrétní stránku stránka. Když ji odstraníte, Google tuto vaši stránku okamžitě rozpozná jako chybějící stránku.
Odstraněním stránky jste tedy nejen sami vytvořili problém s chybami procházení „Nenalezeno“, ale také jste vytvořili problém pro kohokoli, kdo se na tuto stránku někdy připojil. Uživatelé, kteří se na váš web dostanou z jednoho z těchto externích odkazů, obvykle uvidí vaši stránku 404, což není hlavní problém, pokud používáte něco jako vlastní kód 404 společnosti Google, abyste uživatelům poskytli užitečné návrhy nebo alternativy. Měli byste si však myslet, že by mohly existovat elegantnější způsoby, jak odstranit stránky z výsledků vyhledávání, aniž by se všech těch 404 odstartovalo za existující příchozí odkazy, že?
No, jsou.
Odebrání stránky z výsledků vyhledávání Google
Nejprve byste měli pochopit, že pokud webová stránka, kterou chcete odstranit z výsledků vyhledávání Google, není stránka z vašeho vlastního webu, pak máte štěstí, pokud neexistují právní důvody nebo pokud web nezveřejnil vaše osobní údaje online bez vašeho povolení. Pokud je tomu tak, použijte Google Poradce při odstraňování problémů Chcete-li odeslat žádost o odstranění stránky z výsledků vyhledávání. Pokud máte platný případ, může se vám po odstranění stránky objevit nějaký úspěch - samozřejmě můžete mít ještě větší úspěch kontaktování vlastníka webu Jak odstranit falešné osobní údaje na internetuSoukromí online již není zaručeno. Naučte se, jak nahlásit web a odstranit osobní údaje z internetu. Přečtěte si více jak jsem popsal, jak postupovat v roce 2009.
Pokud je tedy stránka, kterou chcete z výsledků vyhledávání odebrat, na vašem vlastním webu, máte štěstí. Vše, co musíte udělat, je vytvořit robots.txt soubor a ujistěte se, že jste zakázali buď konkrétní stránku, kterou nechcete ve výsledcích vyhledávání, nebo celý adresář s obsahem, který nechcete indexovat. Vypadá to, že blokování jedné stránky vypadá.
User-agent: * Disallow: /my-deleted-article-that-i-want-removed.html
Takto můžete blokovat robotům procházení celých adresářů vašeho webu následujícím způsobem.
User-agent: * Disallow: / content-about-personal-stuff /
Google má vynikající stránka podpory které vám mohou pomoci vytvořit soubor robots.txt, pokud jste jej ještě nikdy nevytvořili. Funguje to velmi dobře, jak jsem nedávno vysvětlil v článku o strukturování syndikačních obchodů Jak vyjednat nabídky syndikace a chránit vaše hodnocení žebříčkuSyndikace je v dnešní době zlost. Najednou ale zjistíte, že partner syndikace je ve výsledcích vyhledávání uveden výše než vy ve příběhu, který jste původně napsali! Chraňte své hodnocení ve vyhledávání. Přečtěte si více aby vás neubližovali (požádali partnery syndikace, aby zakázali indexování svých stránek, kde jste syndikováni). Jakmile můj vlastní partner pro syndikaci souhlasil s tím, stránky, které byly duplikovaným obsahem z mého blogu, úplně zmizely z výpisů vyhledávání.
Pouze hlavní web přichází na třetí místo pro stránku, kde je uveden náš název, ale můj blog je nyní uveden na prvním i druhém místě; něco, co by bylo téměř nemožné, kdyby web s vyšší autoritou nechal duplikovanou stránku indexovanou.
Mnoho lidí si neuvědomuje, že toho lze dosáhnout také pomocí internetového archivu (Wayback Machine). Zde jsou řádky, které musíte přidat do souboru robots.txt, aby se to stalo.
User-agent: ia_archiver. Disallow: / sample-category /
V tomto příkladu říkám internetovému archivu, aby z Wayback Machine odstranil cokoli z podadresáře vzorové kategorie na mém webu. Internetový archiv vysvětluje, jak to provést na své stránce nápovědy pro vyloučení. Tady také vysvětlují, že „Internetový archiv nemá zájem nabídnout přístup k webovým stránkám nebo jiným internetovým dokumentům, jejichž autoři nechtějí své materiály ve sbírce.“
To letí v rozporu s běžně věřeným názorem, že cokoli zveřejněné na internetu se do věčnosti zametne do archivu. Ne - webmasteři, kteří vlastní obsah, mohou obsah konkrétně odstranit z archivu pomocí přístupu robots.txt.
Odstraňte jednotlivou stránku se značkami metadat
Pokud máte pouze několik jednotlivých stránek, které chcete z výsledků Vyhledávání Google odebrat, nemusíte ve skutečnosti používat přístup robots.txt. vůbec byste mohli jednoduše přidat správnou metaznačku „roboti“ na jednotlivé stránky a říct robotům, aby neindexovali ani nesledovali odkazy na celé stránce stránka.
Můžete použít metodu „roboti“ výše, abyste zabránili robotům v indexování stránky, nebo můžete specificky říct robotovi Google neindexovat, takže stránka je odebrána pouze z výsledků vyhledávání Google a další vyhledávací roboti by na stránku mohli mít stále přístup obsah.
Záleží jen na vás, jak chcete spravovat, co roboti se stránkou dělají a zda se daná stránka v seznamu uvádí či nikoli. Pro několik samostatných stránek to může být lepší přístup. Chcete-li odebrat celý adresář obsahu, použijte metodu robots.txt.
Idea „odstranění“ obsahu
Tento druh otočí celou myšlenku „mazání obsahu z internetu“ na jeho hlavu. Technicky, pokud odeberete všechny své vlastní odkazy na stránku na svém webu a odeberete ji z Vyhledávání Google a internetu Internetový archiv používající techniku robots.txt, je stránka pro všechny záměry a účely „vymazána“ z Internetu. Skvělá věc je, že pokud existují odkazy na tuto stránku, tyto odkazy budou i nadále fungovat a nevyvoláte pro tyto návštěvníky 404 chyb.
Jedná se o „šetrnější“ přístup k odstraňování obsahu z internetu, aniž by došlo k úplnému zpochybnění stávající popularity odkazů na vašem webu po celém internetu. Nakonec je na vás, jak postupujete, jak spravovat obsah shromažďovaný vyhledávacími nástroji a internetovým archivem, ale vždy Nezapomeňte, že navzdory tomu, co lidé říkají o životnosti věcí, které jsou zveřejňovány online, je to opravdu ve vašem řízení.
Ryan má bakalářský titul z elektrotechniky. Pracoval 13 let v automatizační technice, 5 let v IT a nyní je Apps Engineer. Bývalý šéfredaktor MakeUseOf, vystoupil na národních konferencích o vizualizaci dat a vystupoval v národních televizích a rádiích.