Představte si časné ráno, kdy popíjíte šálek horké čerstvé kávy a váš počítač vám čte nejnovější titulky – vše sám. Nezní to úžasně?

S Pythonem si můžete vytvořit svůj vlastní, personalizovaný program pro čtení zpráv, který za vás přečte všechny hlavní titulky spolu s úryvky každého titulku. Ano to je správně. Použitím správných knihoven můžete přimět Python dělat všechny vaše ranní rutiny, aniž byste museli číst každé slovo sami.

Zde je návod, jak můžete napsat tento kód a vyladit jej na svůj oblíbený zpravodajský web.

Předpoklady pro spuštění kodexu

Než do toho skočíte a začnete psát kód, musíte splnit několik předpokladů. Toto jsou některé velmi základní požadavky, které mohou zjednodušit a zefektivnit používání Pythonu.

  1. Krajta: Mít nainstalovanou nejnovější verzi Pythonu by bylo dobré rozhodnutí. Pro dosažení nejlepších výsledků můžete nainstalovat libovolné IDE Pythonu.
  2. Zpravodajský web/přístup k internetu: Vzhledem k tomu, že kód Python čte horní titulky z vašeho oblíbeného webu, musíte se ujistit, že máte přístup k webu při spuštění tohoto kódu.
instagram viewer

Celý kód je napsán v populárním Jupyter Notebooku Python IDE pro tento návod. Kromě toho je zpravodajský web India Today kódován v ukázkovém kódu.

Chcete-li si stáhnout Jupyter Notebook, můžete jej použít buď jako součást balíčku anaconda, nebo si stáhnout samostatnou verzi do svého systému.

Stažení:Anakonda | Notebook Jupyter

Bez dalších okolků se pojďme ponořit hlouběji do kódu.

Psaní kódu v Pythonu

Chcete-li začít, musíte importovat několik knihoven Pythonu, z nichž každá slouží jiným účelům.

importovat win32com.client jako wincl
z urllib.request importovat urlopen jako ureq
z bs4 importujte BeautifulSoup jako polévku
sp = wincl. Dispatch("SAPI.spVoice")

Kde:

  • win32com.client: Tato knihovna spolupracuje se zařízeními Windows a bezproblémově spouští programy Pythonu.
  • urllib.request: Tato knihovna zpracovává hodnoty URL z modulu požadavku.
  • bs4: Knihovna BS4 obsahuje funkci Beautiful Soup, která stahuje data z webových stránek pomocí Pythonu.
  • sp = wincl. Dispatch("SAPI.spVoice"): Aktivujte hlasové příkazy ve Windows.

Tento kód bude fungovat pouze v systému Windows, protože budete volat knihovnu win32.com.client.

Dále musíte definovat URL (odkaz) webové stránky v url proměnná, která je uložena v paměti Pythonu.

url = https://www.indiatoday.in/top-stories

Vytvořte nového proměnného klienta pro uložení příkazu pro otevření adresy URL.

klient = ureq (url)
tisknout (klient)

kde:

  • klient: Nová proměnná.
  • ureq: Funkce Python importovaná z urllib.request, která otevře uloženou adresu URL.

Vzhledem k tomu, že jste otevřeli URL v paměti, je čas zkontrolovat, zda dotyčný web umožňuje nezabezpečená připojení přes Python. Klientskou proměnnou můžete vytisknout a zkontrolovat výstup.

Příkaz print má dvě možnosti:

  • HTTPError: Když je web zabezpečený, nemůžete obsah seškrabovat pomocí Pythonu.
  • Úryvek kódu: Pokud se po spuštění webu vrátí úryvek kódu, předpokládejte, že titulky můžete snadno stáhnout.

Jakmile definujete adresu URL zpravodajského webu v příkazu URL, je čas importovat HTML kód do proměnné.

page_html = client.read()
tisknout (page_html)

Jako preventivní krok musíte vytisknout HTML kód webu importovaný do Pythonu. Tento kód můžete dokonce porovnat s kódem webové stránky dostupným pod Kontrolovat volba.

Před převodem kódu musíte web zavřít z paměti Pythonu pomocí příkazu close.

client.close()

Protože máte HTML kód importovaný do proměnné Pythonu, musíte jej převést do formátu čitelného v Pythonu, abyste mohli použít nalézt a najít vše příkazy k vyhledání klíčových slov.

Pro převod HTML kódu můžete předat následující příkaz:

page_soup = polévka (page_html, "html.parser")

Kde:

  • page_soup: Nová proměnná.
  • polévka: Přezdívka pro Krásný modul polévky.
  • page_html: Proměnná, která obsahuje HTML kód z webu.
  • html_parser: Výchozí syntaxe pro převod kódu HTML.

Jakmile je kód připraven k použití, je čas prozkoumat HTML kód webové stránky a začít hledat klíčová slova pro nadpis.

Chcete-li tak učinit, klepněte pravým tlačítkem myši kdekoli na webu a klepněte na Prohlédnout. Tím se otevře HTML kód pro danou webovou stránku.

V okně kódu webu procházejte, dokud nenajdete značky kontejneru, které ukládají nadpisy.

Ty jsou obsaženy v zobrazit obsah tagy na webu India Today. Kontejnery každého zpravodajského webu se liší, ale měli byste být schopni procházet kódem relativně snadno.

články = page_soup.find("div", { "class": "view-content" })

Nakonec musíte zachytit dílčí značky, které obsahují hlavní titulky, které vám Python bude číst.

article = articles.findAll("div", {"class": "catagory-listing"})

Kontejner obsahu zobrazení bude obsahovat několik nadpisů, vnější obal pro vaše nadpisy.

Chcete-li zachytit značky H2 a úryvky uvedené u každého nadpisu, musíte spustit smyčku.

i = 1
pro x v článcích:
title = x.find("h2").text
para = x.find("p").text
tisknout (i, název, "
", "
", odst. "
", "
")
sp. Mluvit (název)
sp. Mluvit (odst.)
i=i+1

Kde:

  • já: Nová proměnná čítače, která se bude automaticky zvyšovat.
  • titul: Nová proměnná pro uložení nadpisu (h2).
  • odst.: Nová proměnná pro uložení odstavců spojených s každým H2.
  • vytisknout: Název nadpisu a odstavce budou vytištěny v rozhraní Pythonu.
  • sp. Mluvit (titul): Python přečte každý uložený titul.
  • sp. Mluvit (odst.): Python přečte každý uložený úryvek odstavce.
  • i = i+1: Tento příkaz automaticky zvýší sériové číslo spojené s každým nadpisem zobrazeným v rozhraní Pythonu.

Pomocí modulu Krásná polévka Pythonu ke čtení vašich denních zpráv

Pokaždé, když kód spustíte, budou staženy nové titulky ze zpravodajského webu, než budou přečteny nahlas. Python spustí kód pokaždé, když spustíte sadu kódů, čímž vás informuje o změnách na webu.

Starší titulky budou nadále zobrazovány a čteny Pythonem, dokud kód neobnovíte a znovu nespustíte.

Použití Pythonu ke čtení vašich denních titulků je snadné

Python jako open-source jazyk nabízí řadu nástrojů, jako je Beautiful Soup, Selenium a další frameworky – začátečníkům i pokročilým uživatelům.

Pokud chcete, aby vaše každodenní zprávy byly doručovány hlasem, Python to usnadňuje. Naučit se tento konkrétní jazyk vám také může pomoci stát se lepším programátorem ve všech oblastech.

10 užitečných nástrojů pro vývojáře Pythonu

Ať už potřebujete nástroje Pythonu pro datovou vědu, strojové učení, vývoj webu nebo cokoli mezi tím, tento seznam vás pokryje.

Přečtěte si další

PodíltweetE-mailem
Související témata
  • Programování
  • Krajta
  • Zprávy
  • Počítačové tipy
  • Programování
O autorovi
Gaurav Siyal (56 publikovaných článků)

Gaurav Siyal má dva roky zkušeností s psaním, psaním pro řadu digitálních marketingových firem a dokumentů životního cyklu softwaru.

Více od Gaurava Siyala

Přihlaste se k odběru našeho newsletteru

Připojte se k našemu zpravodaji a získejte technické tipy, recenze, bezplatné e-knihy a exkluzivní nabídky!

Chcete-li se přihlásit k odběru, klikněte sem