Chcete vědět, jak můžete pomocí terminálu zachytit webovou stránku a uložit ji jako dokument PDF nebo obrázek? Naštěstí má Linux nepřeberné množství nástrojů, které můžete použít k automatizaci úkolu převodu dokumentů HTML na soubory PDF a obrázky.

Tento článek vám představí wkhtmltopdf a wkhtmltoimage, nástroje, které vám usnadní práci.

Jak převést HTML na PDF

Pokud chcete zachytit webové stránky a převést je do souboru PDF, pomůže vám nástroj wkhtmltopdf. Wkhtmltopdf je open-source nástroj příkazového řádku používaný k vykreslování webových stránek do dokumentů PDF.

Vzhledem k tomu, že tento nástroj funguje bezhlavě uvnitř terminálu Linux, nebudete potřebovat žádný webový ovladač ani rámec automatizace prohlížeče, jako je Selenium.

Nainstalujte wkhtmltopdf na Linux

Wkhtmltopdf není jedním ze standardních balíčků, které jsou předinstalovány v systému Linux. Budete jej muset nainstalovat ručně pomocí správce balíčků vašeho systému.

Chcete-li nainstalovat wkhtmltopdf na distribuce založené na Ubuntu a Debian:

instagram viewer
sudo apt nainstalovat wkhtmltopdf

Na distribucích založených na archu, jako je Manjaro Linux:

sudo pacman -S wkhtmltopdf

Instalace wkhtmltopdf na distribuce založené na RHEL jako Fedora a CentOS je také snadné.

sudo dnf install wkhtmltopdf

Základní syntaxe

Základní syntaxe příkazu je:

název souboru webové stránky wkhtmltopdf

...kde webová stránka je URL webové stránky, kterou chcete převést a název souboru je název výstupního souboru PDF.

Jak převést domovskou stránku Google na dokument PDF:

wkhtmltopdf https://google.com google.pdf

Výstup:

Po otevření souboru PDF si všimnete, že wkhtmltopdf přesně vykreslil webovou stránku do dokumentu.

Tisk více kopií webové stránky

The - kopie flag je zachránce, pokud chcete, aby váš výstupní soubor měl více kopií webové stránky. Upozorňujeme, že při tisku více kopií nebude wkhtmltopdf generovat více souborů PDF, ale místo toho přidá další stránky do jednoho dokumentu.

Vytvoření tří kopií domovské stránky Google:

wkhtmltopdf - kopie 3 https://google.com google.pdf

Výstupní soubor PDF bude obsahovat tři stránky, jak je uvedeno ve výše uvedeném příkazu.

Přidejte na výstup filtr ve stupních šedi

Chcete-li do souboru PDF přidat filtr ve stupních šedi, použijte -G nebo --šedá stupnice vlajka s příkazem:

wkhtmltopdf -g https://google.com google.pdf
wkhtmltopdf - stupnice šedé https://google.com google.pdf

Výstupní soubor:

Změňte orientaci PDF

Ve výchozím nastavení wkhtmltopdf generuje soubor PDF ve svislém rozvržení, tj. Na výšku. Chcete-li změnit toto výchozí chování a místo toho zachytit webové stránky na šířku, použijte --orientace vlajka s příkazem:

wkhtmltopdf - orientační krajina https://google.com google.pdf

Výstup:

Všimněte si, že verze dokumentu na šířku má ve srovnání s portrétem větší bílou oblast.

Nezahrnujte obrázky při převodu

Pokud při generování výstupu nechcete, aby wkhtmltopdf vykresloval obrázky přítomné na webové stránce, použijte - žádné obrázky vlajka:

wkhtmltopdf - žádné obrázky https://google.com google.pdf

Výstup:

Příbuzný: Nejlepší nástroje pro úpravy souboru PDF kdekoli

Jak převést webovou stránku na obrázky

Obslužný program wkhtmltoimage je součástí balíčku wkhtmltopdf. Pokud pracujete na sestavě a chcete zahrnout obrázky webových stránek, bude tento nástroj fungovat ve váš prospěch. Terminál Linux vám nejen usnadňuje zachycení obrázků, ale také vám nabízí řadu možností, které vám umožní přizpůsobit váš výstup.

Základní syntaxe

Wkhtmltoimage má syntaxi podobnou wkhtmltopdf:

název souboru webové stránky wkhtmltoimage

...kde webová stránka je URL webové stránky a název souboru je název výstupního obrazu.

Převeďte webovou stránku na obrázek

V pokračování výše uvedeného příkladu pojďme převést domovskou stránku Google na obrázky.

wkhtmlobrázek https://google.com google.png

Výstup:

Můžete také určit vlastní formát souboru, který má mít výstupní obraz. Wkhtmltoimage podporuje následující přípony souborů:

  • JPEG / JPG
  • PNG
  • SVG

Například pokud chcete vygenerovat obrázek JPG, jednoduše nahraďte v příkazu příponu souboru JPG:

wkhtmlobrázek https://google.com google.jpg

Příbuzný: JPG vs. JPEG: Jaký je rozdíl mezi těmito formáty obrazových souborů?

Zachycení webových stránek pomocí terminálu Linux

Chcete-li zobrazit soubory PDF generované programem wkhtmltopdf, musíte mít ve svém systému Linux nainstalován prohlížeč PDF. Zatímco většina distribucí systému Linux je dodávána s předinstalovaným editorem PDF, můžete si ručně vybrat a nainstalovat editor PDF, který vyhovuje vašim potřebám.

E-mailem
5 nejlepších editorů PDF pro Linux, které byste měli vyzkoušet

Potřebujete upravit soubor PDF v systému Linux? Tyto Linux PDF editory se instalují zdarma a snadno se používají.

Přečtěte si další

Související témata
  • Linux
  • PDF
  • Linux
O autorovi
Deepesh Sharma (67 článků publikováno)

Deepesh je Junior Editor pro Linux na MUO. Píše informační obsah na internetu již více než 3 roky. Ve volném čase rád píše, poslouchá hudbu a hraje na kytaru.

Více od Deepesh Sharma

Přihlaste se k odběru našeho zpravodaje

Připojte se k našemu zpravodaji s technickými tipy, recenzemi, bezplatnými elektronickými knihami a exkluzivními nabídkami!

Ještě jeden krok…!

V e-mailu, který jsme vám právě poslali, potvrďte svou e-mailovou adresu.

.