Pandas je open-source Python knihovna používaná hlavně pro manipulaci a analýzu dat. Je postavena na knihovně NumPy a poskytuje vysoce výkonné, snadno použitelné datové struktury a nástroje pro analýzu dat pro programovací jazyk Python.

V tomto článku se dozvíte, jak provádět 6 základních operací pomocí Pandas.

Příklady použití Pandy

Příklady v tomto článku můžete spustit pomocí výpočetních notebooků jako Notebook Jupyter, Google Colab, atd. Příklady můžete také spustit zadáním kódu přímo do interpretu Pythonu v interaktivním režimu.

Pokud se chcete podívat na úplný zdrojový kód použitý v tomto článku, můžete získat přístup k souboru Python Notebook z tohoto úložiště GitHub.

1. Jak importovat pandy jako pd a vytisknout číslo verze

Musíte použít import klíčové slovo pro import libovolné knihovny v Pythonu. Pandy se obvykle dovážejí pod pd alias. S tímto přístupem můžete odkazovat na balíček Pandas jako pd namísto pandy.

importovat pandy jako pd
tisknout (str.__verze__)

Výstup:

1.2.4

2. Jak vytvořit sérii v Pandas

instagram viewer

Řada Pandas je jednorozměrné pole, které obsahuje data jakéhokoli typu. Je to jako sloupec v tabulce. Můžete vytvořit řadu pomocí numpy polí, numpy funkcí, seznamů, slovníků, skalárních hodnot atd.

Hodnoty řady jsou označeny svým indexovým číslem. Ve výchozím nastavení má první hodnota index 0, druhá hodnota má index 1 a tak dále. Chcete-li pojmenovat své vlastní štítky, musíte použít index argument.

Jak vytvořit prázdnou sérii

s = pd. Série (dtype='float64')
s

Výstup:

Series([], dtype: float64)

Ve výše uvedeném příkladu je prázdná řada s plovák je vytvořen datový typ.

Jak vytvořit sérii pomocí NumPy Array

importovat pandy jako pd
import numpy jako np
d = np.array([1, 2, 3, 4, 5])
s = pd. série (d)
s

Výstup:

0 1
1 2
2 3
3 4
4 5
dtype: int32

Příbuzný: NumPy operace pro začátečníky

Jak vytvořit sérii pomocí seznamu

d = [1, 2, 3, 4, 5]
s = pd. série (d)
s

Výstup:

0 1
1 2
2 3
3 4
4 5
dtype: int64

Jak vytvořit sérii s indexem

Chcete-li vytvořit řadu s indexem, musíte použít index argument. Počet indexů se musí rovnat počtu prvků v řadě.

d = [1, 2, 3, 4, 5]
s = pd. Řada (d, index=["jeden", "dva", "tři", "čtyři", "pět"])
s

Výstup:

jeden 1
dva 2
tři 3
čtyři 4
pět 5
dtype: int64

Jak vytvořit sérii pomocí slovníku

Klíče slovníku se stávají štítky série.

d = {"jedna": 1,
"dva": 2,
"tři": 3,
"čtyři": 4,
"pět": 5}
s = pd. série (d)
s

Výstup:

jeden 1
dva 2
tři 3
čtyři 4
pět 5
dtype: int64

Jak vytvořit řadu pomocí skalární hodnoty

Pokud chcete vytvořit řadu pomocí skalární hodnoty, musíte zadat index argument.

s = pd. Řada (1, index = ["a", "b", "c", "d"])
s

Výstup:

1
b 1
c 1
d 1
dtype: int64

3. Jak vytvořit datový rámec v Pandas

DataFrame je dvourozměrná datová struktura, kde jsou data zarovnána ve formě řádků a sloupců. DataFrame lze vytvořit pomocí slovníků, seznamů, seznamu slovníků, numpy polí atd. V reálném světě jsou DataFrames vytvářeny pomocí existujícího úložiště, jako jsou soubory CSV, soubory Excel, databáze SQL atd.

Objekt DataFrame podporuje řadu atributů a metod. Pokud se o nich chcete dozvědět více, můžete se podívat na oficiální dokumentaci datový rámec pandy.

Jak vytvořit prázdný DataFrame

df = pd. DataFrame()
tisknout (df)

Výstup:

Prázdný DataFrame
Sloupce: []
Index: []

Jak vytvořit DataFrame pomocí List

listObj = ["MUO", "technologie", "zjednodušeno"]
df = pd. DataFrame (listObj)
tisknout (df)

Výstup:

 0
0 MUO
1 technologie
2 zjednodušené

Jak vytvořit DataFrame pomocí Dictionary of ndarray/Lists

batmanData = {'Název filmu': ['Batman začíná', 'Temný rytíř', 'Temný rytíř povstal'],
'Rok vydání': [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
tisknout (df)

Výstup:

 Název filmu Rok vydání
0 Batman začíná 2005
1 Temný rytíř 2008
2 Temný rytíř povstal 2012

Jak vytvořit datový rámec pomocí seznamu seznamů

data = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (data, sloupce = ['Name', 'Roll No.'])
tisknout (df)

Výstup:

 Jméno Role č.
0 Alex 601
1 Bob 602
2 Cataline 603

Jak vytvořit DataFrame pomocí seznamu slovníků

data = [{'Name': 'Alex', 'Roll No.': 601},
{'Name': 'Bob', 'Roll No.': 602},
{'Name': 'Cataline', 'Roll No.': 603}]
df = pd. DataFrame (data)
tisknout (df)

Výstup:

 Jméno Role č.
0 Alex 601
1 Bob 602
2 Cataline 603

Příbuzný: Jak převést seznam na slovník v Pythonu

Jak vytvořit DataFrame pomocí funkce zip().

Použijte zip() funkce pro sloučení seznamů v Pythonu.

Jméno = ['Alex', 'Bob', 'Cataline']
Číslo role = [601, 602, 603]
listOfTuples = seznam (zip (název, číslo role))
df = pd. DataFrame (listOfTuples, columns = ['Name', 'Roll No.'])
tisknout (df)

Výstup:

 Jméno Role č.
0 Alex 601
1 Bob 602
2 Cataline 603

4. Jak číst data CSV v Pandas

Soubor „hodnoty oddělené čárkou“ (CSV) je textový soubor s oddělovači, který k oddělení hodnot používá čárku. Soubor CSV můžete číst pomocí read_csv() metoda u pand. Pokud chcete vytisknout celý DataFrame, použijte to_string() metoda.

V tomto a následujících příkladech toto CSV soubor budou použity k provádění operací.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tisknout (df.to_string())

Výstup:

5. Jak analyzovat datové rámce pomocí metod head(), tail() a info().

Jak zobrazit data pomocí metody head().

The hlava() metoda je jedním z nejlepších způsobů, jak získat rychlý přehled o DataFrame. Tato metoda vrací záhlaví a zadaný počet řádků, počínaje shora.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tisk (df.head (10))

Výstup:

Pokud nezadáte počet řádků, vrátí se prvních 5 řádků.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tisknout (df.head())

Výstup:

Jak zobrazit data pomocí metody tail().

The ocas() metoda vrací záhlaví a zadaný počet řádků, počínaje zdola.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tisk (df.tail (10))

Výstup:

Pokud nezadáte počet řádků, vrátí se posledních 5 řádků.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tisknout (df.tail())

Výstup:

Jak získat informace o datech

The info() metody vracejí stručné shrnutí DataFrame včetně indexu dtype a sloupcových dtypes, hodnot bez hodnoty null a využití paměti.

df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
tisknout (df.info())

Výstup:

6. Jak číst data JSON v Pandas

JSON (JavaSkript Óbject Notation) je odlehčený formát pro výměnu dat. Soubor JSON můžete číst pomocí read_json() metoda u pand. Pokud chcete vytisknout celý DataFrame, použijte to_string() metoda.

V níže uvedeném příkladu toto soubor JSON se používá k provádění operací.

Příbuzný: Co je JSON? Laický přehled

df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
tisknout (df.to_string())

Výstup:

Osvěžte své znalosti Pythonu pomocí vestavěných funkcí a metod

Funkce pomáhají zkrátit váš kód a zlepšit jeho efektivitu. Funkce a metody jako snížit(), rozdělit(), vyjmenovat(), eval(), kolo(), atd. může váš kód učinit robustním a snadno pochopitelným. Vždy je dobré vědět o vestavěných funkcích a metodách, protože mohou do značné míry zjednodušit vaše programovací úlohy.

PodíltweetE-mailem
20 funkcí Pythonu, které byste měli znát

Standardní knihovna Pythonu obsahuje mnoho funkcí, které vám pomohou s vašimi programovacími úlohami. Přečtěte si o nejužitečnějších a vytvořte robustnější kód.

Přečtěte si další

Související témata
  • Programování
  • Krajta
  • Vývoj webu
  • Programování
  • Analýza dat
O autorovi
Yuvraj Chandra (Publikováno 69 článků)

Yuvraj je vysokoškolským studentem informatiky na univerzitě v Dillí v Indii. Je nadšený pro Full Stack Web Development. Když zrovna nepíše, zkoumá hloubku různých technologií.

Více od Yuvraj Chandra

Přihlaste se k odběru našeho newsletteru

Připojte se k našemu zpravodaji a získejte technické tipy, recenze, bezplatné e-knihy a exkluzivní nabídky!

Chcete-li se přihlásit k odběru, klikněte sem