Pandas je open-source Python knihovna používaná hlavně pro manipulaci a analýzu dat. Je postavena na knihovně NumPy a poskytuje vysoce výkonné, snadno použitelné datové struktury a nástroje pro analýzu dat pro programovací jazyk Python.
V tomto článku se dozvíte, jak provádět 6 základních operací pomocí Pandas.
Příklady použití Pandy
Příklady v tomto článku můžete spustit pomocí výpočetních notebooků jako Notebook Jupyter, Google Colab, atd. Příklady můžete také spustit zadáním kódu přímo do interpretu Pythonu v interaktivním režimu.
Pokud se chcete podívat na úplný zdrojový kód použitý v tomto článku, můžete získat přístup k souboru Python Notebook z tohoto úložiště GitHub.
1. Jak importovat pandy jako pd a vytisknout číslo verze
Musíte použít import klíčové slovo pro import libovolné knihovny v Pythonu. Pandy se obvykle dovážejí pod pd alias. S tímto přístupem můžete odkazovat na balíček Pandas jako pd namísto pandy.
importovat pandy jako pd
tisknout (str.__verze__)
Výstup:
1.2.4
2. Jak vytvořit sérii v Pandas
Řada Pandas je jednorozměrné pole, které obsahuje data jakéhokoli typu. Je to jako sloupec v tabulce. Můžete vytvořit řadu pomocí numpy polí, numpy funkcí, seznamů, slovníků, skalárních hodnot atd.
Hodnoty řady jsou označeny svým indexovým číslem. Ve výchozím nastavení má první hodnota index 0, druhá hodnota má index 1 a tak dále. Chcete-li pojmenovat své vlastní štítky, musíte použít index argument.
Jak vytvořit prázdnou sérii
s = pd. Série (dtype='float64')
s
Výstup:
Series([], dtype: float64)
Ve výše uvedeném příkladu je prázdná řada s plovák je vytvořen datový typ.
Jak vytvořit sérii pomocí NumPy Array
importovat pandy jako pd
import numpy jako np
d = np.array([1, 2, 3, 4, 5])
s = pd. série (d)
s
Výstup:
0 1
1 2
2 3
3 4
4 5
dtype: int32
Příbuzný: NumPy operace pro začátečníky
Jak vytvořit sérii pomocí seznamu
d = [1, 2, 3, 4, 5]
s = pd. série (d)
s
Výstup:
0 1
1 2
2 3
3 4
4 5
dtype: int64
Jak vytvořit sérii s indexem
Chcete-li vytvořit řadu s indexem, musíte použít index argument. Počet indexů se musí rovnat počtu prvků v řadě.
d = [1, 2, 3, 4, 5]
s = pd. Řada (d, index=["jeden", "dva", "tři", "čtyři", "pět"])
s
Výstup:
jeden 1
dva 2
tři 3
čtyři 4
pět 5
dtype: int64
Jak vytvořit sérii pomocí slovníku
Klíče slovníku se stávají štítky série.
d = {"jedna": 1,
"dva": 2,
"tři": 3,
"čtyři": 4,
"pět": 5}
s = pd. série (d)
s
Výstup:
jeden 1
dva 2
tři 3
čtyři 4
pět 5
dtype: int64
Jak vytvořit řadu pomocí skalární hodnoty
Pokud chcete vytvořit řadu pomocí skalární hodnoty, musíte zadat index argument.
s = pd. Řada (1, index = ["a", "b", "c", "d"])
s
Výstup:
1
b 1
c 1
d 1
dtype: int64
3. Jak vytvořit datový rámec v Pandas
DataFrame je dvourozměrná datová struktura, kde jsou data zarovnána ve formě řádků a sloupců. DataFrame lze vytvořit pomocí slovníků, seznamů, seznamu slovníků, numpy polí atd. V reálném světě jsou DataFrames vytvářeny pomocí existujícího úložiště, jako jsou soubory CSV, soubory Excel, databáze SQL atd.
Objekt DataFrame podporuje řadu atributů a metod. Pokud se o nich chcete dozvědět více, můžete se podívat na oficiální dokumentaci datový rámec pandy.
Jak vytvořit prázdný DataFrame
df = pd. DataFrame()
tisknout (df)
Výstup:
Prázdný DataFrame
Sloupce: []
Index: []
Jak vytvořit DataFrame pomocí List
listObj = ["MUO", "technologie", "zjednodušeno"]
df = pd. DataFrame (listObj)
tisknout (df)
Výstup:
0
0 MUO
1 technologie
2 zjednodušené
Jak vytvořit DataFrame pomocí Dictionary of ndarray/Lists
batmanData = {'Název filmu': ['Batman začíná', 'Temný rytíř', 'Temný rytíř povstal'],
'Rok vydání': [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
tisknout (df)
Výstup:
Název filmu Rok vydání
0 Batman začíná 2005
1 Temný rytíř 2008
2 Temný rytíř povstal 2012
Jak vytvořit datový rámec pomocí seznamu seznamů
data = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (data, sloupce = ['Name', 'Roll No.'])
tisknout (df)
Výstup:
Jméno Role č.
0 Alex 601
1 Bob 602
2 Cataline 603
Jak vytvořit DataFrame pomocí seznamu slovníků
data = [{'Name': 'Alex', 'Roll No.': 601},
{'Name': 'Bob', 'Roll No.': 602},
{'Name': 'Cataline', 'Roll No.': 603}]
df = pd. DataFrame (data)
tisknout (df)
Výstup:
Jméno Role č.
0 Alex 601
1 Bob 602
2 Cataline 603
Příbuzný: Jak převést seznam na slovník v Pythonu
Jak vytvořit DataFrame pomocí funkce zip().
Použijte zip() funkce pro sloučení seznamů v Pythonu.
Jméno = ['Alex', 'Bob', 'Cataline']
Číslo role = [601, 602, 603]
listOfTuples = seznam (zip (název, číslo role))
df = pd. DataFrame (listOfTuples, columns = ['Name', 'Roll No.'])
tisknout (df)
Výstup:
Jméno Role č.
0 Alex 601
1 Bob 602
2 Cataline 603
4. Jak číst data CSV v Pandas
Soubor „hodnoty oddělené čárkou“ (CSV) je textový soubor s oddělovači, který k oddělení hodnot používá čárku. Soubor CSV můžete číst pomocí read_csv() metoda u pand. Pokud chcete vytisknout celý DataFrame, použijte to_string() metoda.
V tomto a následujících příkladech toto CSV soubor budou použity k provádění operací.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tisknout (df.to_string())
Výstup:
5. Jak analyzovat datové rámce pomocí metod head(), tail() a info().
Jak zobrazit data pomocí metody head().
The hlava() metoda je jedním z nejlepších způsobů, jak získat rychlý přehled o DataFrame. Tato metoda vrací záhlaví a zadaný počet řádků, počínaje shora.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tisk (df.head (10))
Výstup:
Pokud nezadáte počet řádků, vrátí se prvních 5 řádků.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tisknout (df.head())
Výstup:
Jak zobrazit data pomocí metody tail().
The ocas() metoda vrací záhlaví a zadaný počet řádků, počínaje zdola.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tisk (df.tail (10))
Výstup:
Pokud nezadáte počet řádků, vrátí se posledních 5 řádků.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tisknout (df.tail())
Výstup:
Jak získat informace o datech
The info() metody vracejí stručné shrnutí DataFrame včetně indexu dtype a sloupcových dtypes, hodnot bez hodnoty null a využití paměti.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tisknout (df.info())
Výstup:
6. Jak číst data JSON v Pandas
JSON (JavaSkript Óbject Notation) je odlehčený formát pro výměnu dat. Soubor JSON můžete číst pomocí read_json() metoda u pand. Pokud chcete vytisknout celý DataFrame, použijte to_string() metoda.
V níže uvedeném příkladu toto soubor JSON se používá k provádění operací.
Příbuzný: Co je JSON? Laický přehled
df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
tisknout (df.to_string())
Výstup:
Osvěžte své znalosti Pythonu pomocí vestavěných funkcí a metod
Funkce pomáhají zkrátit váš kód a zlepšit jeho efektivitu. Funkce a metody jako snížit(), rozdělit(), vyjmenovat(), eval(), kolo(), atd. může váš kód učinit robustním a snadno pochopitelným. Vždy je dobré vědět o vestavěných funkcích a metodách, protože mohou do značné míry zjednodušit vaše programovací úlohy.
Standardní knihovna Pythonu obsahuje mnoho funkcí, které vám pomohou s vašimi programovacími úlohami. Přečtěte si o nejužitečnějších a vytvořte robustnější kód.
Přečtěte si další
- Programování
- Krajta
- Vývoj webu
- Programování
- Analýza dat

Yuvraj je vysokoškolským studentem informatiky na univerzitě v Dillí v Indii. Je nadšený pro Full Stack Web Development. Když zrovna nepíše, zkoumá hloubku různých technologií.
Přihlaste se k odběru našeho newsletteru
Připojte se k našemu zpravodaji a získejte technické tipy, recenze, bezplatné e-knihy a exkluzivní nabídky!
Chcete-li se přihlásit k odběru, klikněte sem