Hledáte bezplatná data, abyste si procvičili své dovednosti v oblasti analýzy dat? Zde jsou některé z nejlepších webových stránek, které si můžete prohlédnout.
Ať už provádíte průzkum trhu, budujete své portfolio jako analytik nebo hledáte statistiky, abyste rozšířili svůj dosah na trh, cenná a spolehlivá data jsou nezbytná pro informované rozhodování.
Hledání bezplatných, spolehlivých a dostupných dat na internetu má však určité problémy. Tento článek vám usnadní hledání dat tím, že vás seznámí s některými z nejlepších webů pro přístup k bezplatným datům.
Google Trends je bezplatná služba vyvinutá společností Google, která uživatelům poskytuje nefiltrované vzorky dat žádostí o vyhledávání odeslaných společnosti Google. I když tato služba zobrazuje data časových řad od roku 2004 do současnosti na globální úrovni i na úrovni měst, nezobrazuje osobní údaje uživatelů vyhledávače.
Můžete také omezit data tak, aby se zaměřila na kategorie, jazyky, entity nebo trendy vyhledávání na Googlu pomocí Google Trends
. Příklady dostupných údajů zahrnují denní trendy vyhledávání a trendy vyhledávání v reálném čase, které ukazují data za posledních sedm dní.FiveThirtyEight je webová stránka datové žurnalistiky, která obsahuje údaje o analýze průzkumů, sportu, popkultuře, politice, vědě a ekonomických událostech.
Skvělá věc na webu je, že si můžete stáhnout data z jejich webových stránek nebo jejich oficiální úložiště GitHub a použijte svůj nástroje pro vizualizaci dat k vytvoření podmanivých vizuálů datové žurnalistiky pro vaše publikum. Několik příkladů dostupných zajímavých dat zahrnuje např předpovědi mistrovství světa a Údaje o předpovědích NHL 2022–23.
BuzzFeed News je americká nejnovější zpravodajská a originální zpravodajská platforma, která informuje o všem od žurnalistiky, techniky, zábavy, zpráv o celebritách, kultuře a DIY hackech až po zdraví a politiku.
BuzzFeed News na svém GitHubu zpřístupňuje, zpřístupňuje a zpřístupňuje svou datovou sadu, nástroje a analýzy z redakce BuzzFeedu jako open source. Příklad zahrnuje Údaje o serióznosti střelných zbraní FBI NICS.
Data.gov je webová stránka vlády Spojených států pro otevřená data, která hostí více než 250 000 veřejně dostupných, dobře zdokumentovaných datových sad od mezinárodních a mnoha federálních vládních agentur. Myšlenkou této iniciativy bylo poskytnout otevřenou a transparentní vládu.
K údajům z webu máte přístup na základě tématu a agentury nebo organizace. Některé příklady dat, které můžete najít na Data.gov, jsou národní datový systém studentských půjček a údaje o počtu obyvatel elektrických vozidel.
Kaggle je veřejné datové hřiště získané společností Google, které nabízí širokou škálu datových sad na různá témata. Tato komunitní platforma vám umožňuje sdílet vaše kódy, učit se, spolupracovat s dalšími datovými profesionály a zdokonalovat se. Kaggle také pořádá soutěže v oblasti datové vědy, kde můžete vyhrát různé ceny.
Tato příručka poskytuje a průvodce pro začátečníky, jak začít s Kaggle pro datovou vědu. Příkladem je Globální statistiky YouTube 2023.
EarthData je datová iniciativa NASA, která slouží jako úložiště dat o Zemi od roku 1994 do současnosti. Můžete získat data související z informací ze vzdáleného satelitu s daty o zemské atmosféře, oceánu a pozemské hydrosféře.
Můžete procházet různá témata a přistupovat k datům jako údaje o extrémních teplotách. Budete však muset prozkoumat Planetární datový systém NASA pro data mimo Zemi.
IMDb poskytuje data o filmech, televizních seriálech, domácích videích, podcastech, videohrách, streamovaných informacích a obsahu celebrit. Příkladem je Nekomerční datové sady IMDb.
AWS Public Dataset je webová stránka, která hostí více než 3000 datových sad datových sad veřejně dostupných prostřednictvím služeb AWS. Většina datových sad je založena na projektu. Některé zahrnují atlas genomu rakoviny a Foldingathome datové sady COVID-19.
Inside Airbnb je hlídací web, který spustil Murray Cox. Tato webová stránka pochází z veřejně dostupných dat Airbnb, platforma, která uživatelům nabízí cenově výhodné pokoje po celém světě. Informace z tohoto webu můžete použít k provádění analýz, jako je např analytika pronájmu v Montrealu.
Google Dataset Search je vyhledávač datových sad vytvořený společností Google, který hostí více než 20 milionů datových sad. Stejně jako jejich vyhledávač můžete získat data téměř z čehokoli. Dobrým příkladem je Kanadská národní data dlouhodobého monitorování kvality vody.
UC Irvine Machine Learning Repository je domovem 624 datových sad pro komunitu strojového učení na světě. Tento web má v komunitě silnou pověst, protože datové sady jsou kategorizovány na základě úloh strojového učení, pro které jsou vhodné. Příkladem je Datová sada Iris, slavný klasifikační a shlukovací model datové sady.
Datahub jako platforma má mnoho datových sad, které pokrývají širokou škálu témat, jako je např Výnosy 10letých vládních dluhopisů USA (dlouhodobá úroková sazba). Kromě dat zobrazují také datové nástroje a sady nástrojů, které mohou být užitečné pro datové profesionály.
Toto je první webová stránka na našem seznamu pro exkluzivní zdravotní údaje. Global Health Observatory slouží jako datové úložiště zobrazující zdravotní statistiky pro více než 1000 ukazatelů pro 194 členských států WHO. Údaje se zaznamenávají, aby bylo možné sledovat pokrok těchto členských států při plnění cílů SDG. Data můžete získat filtrováním tématu, kategorie, metadat a indikátoru dat.
Tato platforma je opravdu specializovaná. Zobrazuje data z výzkumu a informace o trhu, jako je např čísla víkendových pokladen a související údaje o britském filmovém průmyslu.
GitHub je víc než jen domov milionů společných a open-source projektů. Platforma také hostí mnoho úložišť, jejichž cílem je uchovávat bezplatné, veřejné a open source datové sady. Dokonce BuzzFeedNews má open-source úložiště GitHub.
Dalšími příklady jsou Úžasné úložiště veřejných datových sad a zvednete vůbec datovou sadu. Můžete také přispívat do těchto open-source projektů na GitHubu.
Data.world je datová komunita a platforma pro spolupráci, která hostí datové projekty a datové sady. Zatímco několik datových sad je placených, většina dat na platformě, jako je Přeměna pondělí 2021/W16: měsíční letečtí cestující v Americe, jsou zdarma a lze je snadno stáhnout lokálně nebo k nim přistupovat prostřednictvím jejich API.
Otevřená data Světové banky jsou katalogem globálních ekonomických a rozvojových dat. Data můžete procházet a filtrovat, např globální statistiky o ceně a dostupnosti zdravé stravy podle ukazatele a země.
Nasdaq Data Link je pro všechna finanční, ekonomická a alternativní data. Můžete přistupovat k datům jako např Zveřejnění údajů o federálních rezervách USA pomocí tabulky, jako je Excel nebo API.
Datová platforma NYC Taxi and Limousine Commission zaznamenává a hostí informace, jako např záznamy žluté a zelené cesty taxíkem napříč New York City. Skvělá věc na tomto webu je, že zobrazuje informace o všem, od vyzvednutí/odvozu až po zónu taxíků a jízdné.
Academic Torrents je datový katalog s více než 127,15 TB výzkumných dat. Byl postaven, jak se říká, pro výzkumníky a výzkumníky.
Prozkoumejte a učte se
Doufejme, že s tímto seznamem můžete získat data, která mohou utvářet vaše obchodní prostředí, řídit váš průzkum trhu, získat konkurenční výhodu a pomoci vám bezplatně vybudovat toto jedinečné datové portfolio. Využijte tedy příležitosti, prozkoumejte a proveďte méně náročné hledání dat.