Audioknihy si získávají stále větší oblibu oproti klasickým elektronickým knihám. Jsou pohodlnější, protože je můžete poslouchat kdykoli a kdekoli.
Elektronickou knihu PDF můžete převést na audioknihu pomocí jednoduchého skriptu Python. Pomocí několika jednoduchých knihoven můžete vytvořit projekt, který přečte PDF a uloží audioknihu jako nový soubor.
Instalace požadovaných balíčků
Musíte nainstalovat PyPDF3, pyttsx3, a pdf instalatér balíčky, abyste mohli začít. Tyto balíčky můžete nainstalovat pomocí správce balíčků pip. Ujistěte se, že již máte nainstalovaný pip ve vašem systému. Spuštěním následujícího příkazu na příkazovém řádku nainstalujte balíčky:
pip Nainstalujte PyPDF3 pyttsx3 pdfplumber
- Můžete použít PyPDF3 knihovna pro čtení a úpravu souborů PDF v Pythonu.
- The pyttsx3 knihovna poskytuje převod textu na řeč.
- pdf instalatér je knihovna, která umožňuje extrahovat text a tabulky ze souborů PDF.
Kód použitý v tomto projektu je k dispozici v a úložiště GitHub a můžete jej používat zdarma pod licencí MIT.
Převod PDF na audioknihu pomocí Pythonu
Jakmile nainstalujete výše uvedené balíčky, jste připraveni je importovat do souboru python:
import PyPDF3
import pyttsx3
import pdf instalatér
Musíte zadat název a umístění souboru PDF, který chcete převést. Pro jednoduchost můžete použít jakýkoli vzorový soubor PDF. Zkopírujte jej do stejného adresáře jako váš skript a uložte jeho název do proměnné; jestli se to jmenuje Lorem.pdf, například:
soubor = 'Lorem.pdf'
Dále vytvořte objekt souboru pro soubor PDF a objekt čtečky PDF:
kniha = otevřít (soubor, 'rb')
pdfReader = PyPDF3.PdfFileReader (kniha)
Později budete procházet všemi stránkami souboru PDF. Chcete-li zjistit celkový počet stránek, použijte numPages vlastnictví:
pages = pdfReader.numPages
Nyní jste připraveni extrahovat text ze souboru PDF:
finalText = ""
s pdfplumber.open(soubor) tak jako pdf:
pro i v rozsahu (0, stránky):
page = pdf.pages[i]
text = page.extract_text()
finalText += text
Pomocí smyčky for iterujte všechny stránky a extrahujte text z PDF. K otevření souboru PDF můžete použít balíček pdfplumber extrakt_textu metoda pro načtení textu ze stránky.
S plným textem uloženým v proměnné jej můžete dále zpracovávat v závislosti na vašich požadavcích. Pokud chcete převést text na zvuk a uložit jej do nového souboru, použijte následující kód:
engine = pyttsx3.init()
engine.save_to_file (finalText, 'lorem.mp3')
motor.runAndWait()
Když vás spusťte tento kód Pythonu, vytvoří ve svém adresáři soubor audioknihy.
Pokud si audioknihu nechcete uložit a chcete například recitovat soubor PDF, můžete místo toho použít následující kód:
engine = pyttsx3.init()
motor.říci(finalText)
motor.runAndWait()
Když tento skript spustíte, přečte soubor PDF.
Vyvíjejte projekty pomocí Pythonu
Python je známý svou všestranností. Pomocí Pythonu můžete snadno vytvářet projekty s praktickými aplikacemi.
Pokud si chcete ušpinit ruce kódem Pythonu, můžete začít vývojem miniprojektů. Některé dobré nápady pro začátek jsou kvízová aplikace, chatbot, hra had, zkracovač URL, webový škrabák nebo převodník jednotek.