Chcete vědět, jak můžete pomocí terminálu zachytit webovou stránku a uložit ji jako dokument PDF nebo obrázek? Naštěstí má Linux nepřeberné množství nástrojů, které můžete použít k automatizaci úkolu převodu dokumentů HTML na soubory PDF a obrázky.
Tento článek vám představí wkhtmltopdf a wkhtmltoimage, nástroje, které vám usnadní práci.
Jak převést HTML na PDF
Pokud chcete zachytit webové stránky a převést je do souboru PDF, pomůže vám nástroj wkhtmltopdf. Wkhtmltopdf je open-source nástroj příkazového řádku používaný k vykreslování webových stránek do dokumentů PDF.
Vzhledem k tomu, že tento nástroj funguje bezhlavě uvnitř terminálu Linux, nebudete potřebovat žádný webový ovladač ani rámec automatizace prohlížeče, jako je Selenium.
Nainstalujte wkhtmltopdf na Linux
Wkhtmltopdf není jedním ze standardních balíčků, které jsou předinstalovány v systému Linux. Budete jej muset nainstalovat ručně pomocí správce balíčků vašeho systému.
Chcete-li nainstalovat wkhtmltopdf na distribuce založené na Ubuntu a Debian:
sudo apt nainstalovat wkhtmltopdf
Na distribucích založených na archu, jako je Manjaro Linux:
sudo pacman -S wkhtmltopdf
Instalace wkhtmltopdf na distribuce založené na RHEL jako Fedora a CentOS je také snadné.
sudo dnf install wkhtmltopdf
Základní syntaxe
Základní syntaxe příkazu je:
název souboru webové stránky wkhtmltopdf
...kde webová stránka je URL webové stránky, kterou chcete převést a název souboru je název výstupního souboru PDF.
Jak převést domovskou stránku Google na dokument PDF:
wkhtmltopdf https://google.com google.pdf
Výstup:
Po otevření souboru PDF si všimnete, že wkhtmltopdf přesně vykreslil webovou stránku do dokumentu.
Tisk více kopií webové stránky
The - kopie flag je zachránce, pokud chcete, aby váš výstupní soubor měl více kopií webové stránky. Upozorňujeme, že při tisku více kopií nebude wkhtmltopdf generovat více souborů PDF, ale místo toho přidá další stránky do jednoho dokumentu.
Vytvoření tří kopií domovské stránky Google:
wkhtmltopdf - kopie 3 https://google.com google.pdf
Výstupní soubor PDF bude obsahovat tři stránky, jak je uvedeno ve výše uvedeném příkazu.
Přidejte na výstup filtr ve stupních šedi
Chcete-li do souboru PDF přidat filtr ve stupních šedi, použijte -G nebo --šedá stupnice vlajka s příkazem:
wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf - stupnice šedé https://google.com google.pdf
Výstupní soubor:
Změňte orientaci PDF
Ve výchozím nastavení wkhtmltopdf generuje soubor PDF ve svislém rozvržení, tj. Na výšku. Chcete-li změnit toto výchozí chování a místo toho zachytit webové stránky na šířku, použijte --orientace vlajka s příkazem:
wkhtmltopdf - orientační krajina https://google.com google.pdf
Výstup:
Všimněte si, že verze dokumentu na šířku má ve srovnání s portrétem větší bílou oblast.
Nezahrnujte obrázky při převodu
Pokud při generování výstupu nechcete, aby wkhtmltopdf vykresloval obrázky přítomné na webové stránce, použijte - žádné obrázky vlajka:
wkhtmltopdf - žádné obrázky https://google.com google.pdf
Výstup:
Příbuzný: Nejlepší nástroje pro úpravy souboru PDF kdekoli
Jak převést webovou stránku na obrázky
Obslužný program wkhtmltoimage je součástí balíčku wkhtmltopdf. Pokud pracujete na sestavě a chcete zahrnout obrázky webových stránek, bude tento nástroj fungovat ve váš prospěch. Terminál Linux vám nejen usnadňuje zachycení obrázků, ale také vám nabízí řadu možností, které vám umožní přizpůsobit váš výstup.
Základní syntaxe
Wkhtmltoimage má syntaxi podobnou wkhtmltopdf:
název souboru webové stránky wkhtmltoimage
...kde webová stránka je URL webové stránky a název souboru je název výstupního obrazu.
Převeďte webovou stránku na obrázek
V pokračování výše uvedeného příkladu pojďme převést domovskou stránku Google na obrázky.
wkhtmlobrázek https://google.com google.png
Výstup:
Můžete také určit vlastní formát souboru, který má mít výstupní obraz. Wkhtmltoimage podporuje následující přípony souborů:
- JPEG / JPG
- PNG
- SVG
Například pokud chcete vygenerovat obrázek JPG, jednoduše nahraďte v příkazu příponu souboru JPG:
wkhtmlobrázek https://google.com google.jpg
Příbuzný: JPG vs. JPEG: Jaký je rozdíl mezi těmito formáty obrazových souborů?
Zachycení webových stránek pomocí terminálu Linux
Chcete-li zobrazit soubory PDF generované programem wkhtmltopdf, musíte mít ve svém systému Linux nainstalován prohlížeč PDF. Zatímco většina distribucí systému Linux je dodávána s předinstalovaným editorem PDF, můžete si ručně vybrat a nainstalovat editor PDF, který vyhovuje vašim potřebám.
Potřebujete upravit soubor PDF v systému Linux? Tyto Linux PDF editory se instalují zdarma a snadno se používají.
Přečtěte si další
- Linux
- Linux
Deepesh je Junior Editor pro Linux na MUO. Píše informační obsah na internetu již více než 3 roky. Ve volném čase rád píše, poslouchá hudbu a hraje na kytaru.
Přihlaste se k odběru našeho zpravodaje
Připojte se k našemu zpravodaji s technickými tipy, recenzemi, bezplatnými elektronickými knihami a exkluzivními nabídkami!
Ještě jeden krok…!
V e-mailu, který jsme vám právě poslali, potvrďte svou e-mailovou adresu.