Pandas on avatud lähtekoodiga Pythoni teek, mida kasutatakse peamiselt andmete töötlemiseks ja analüüsimiseks. See on üles ehitatud NumPy teegile ning pakub Pythoni programmeerimiskeele jaoks suure jõudlusega, lihtsalt kasutatavaid andmestruktuure ja andmeanalüüsi tööriistu.
Sellest artiklist saate teada, kuidas Pandade abil teha 6 põhitoimingut.
Panda näidete kasutamine
Selle artikli näiteid saate käivitada, kasutades selliseid arvutusmärkmikke nagu Jupyteri märkmik, Google Colab, jne. Näiteid saate käivitada ka sisestades koodi interaktiivses režiimis otse Pythoni interpretaatorisse.
Kui soovite vaadata kogu selles artiklis kasutatud lähtekoodi, pääsete Pythoni märkmiku failile juurde siit GitHubi hoidla.
1. Kuidas importida Pandasid pd-vormingus ja printida versiooninumber
Peate kasutama importida märksõna mis tahes teegi importimiseks Pythonis. Pandasid imporditakse tavaliselt all pd teise nimega. Selle lähenemisviisi korral saate Panda paketile viidata kui pd selle asemel pandad.
importida pandad pd-na
print (pd.__version__)
Väljund:
1.2.4
2. Kuidas Pandas sarja luua
Pandas Series on ühemõõtmeline massiiv, mis sisaldab mis tahes tüüpi andmeid. See on nagu veerg tabelis. Saate luua seeriaid, kasutades numpy massiive, numpy funktsioone, loendeid, sõnastikke, skalaarväärtusi jne.
Seeria väärtused on märgistatud nende indeksinumbriga. Vaikimisi on esimesel väärtusel indeks 0, teisel väärtusel indeks 1 ja nii edasi. Oma siltide nimetamiseks peate kasutama indeks argument.
Kuidas luua tühja seeriat
s = pd. Seeria (dtype='float64')
s
Väljund:
Series([], dtype: float64)
Ülaltoodud näites on tühi seeria ujuk luuakse andmetüüp.
Kuidas luua seeriat NumPy massiivi abil
importida pandad pd-na
import numpy as np
d = np.massiiv([1, 2, 3, 4, 5])
s = pd. Seeria (d)
s
Väljund:
0 1
1 2
2 3
3 4
4 5
dtype: int32
Seotud: NumPy toimingud algajatele
Kuidas luua sarja kasutades loendit
d = [1, 2, 3, 4, 5]
s = pd. Seeria (d)
s
Väljund:
0 1
1 2
2 3
3 4
4 5
dtype: int64
Kuidas luua indeksiga seeriat
Indeksiga seeria loomiseks peate kasutama indeks argument. Indeksite arv peab olema võrdne seeria elementide arvuga.
d = [1, 2, 3, 4, 5]
s = pd. Seeria (d, indeks=["üks", "kaks", "kolm", "neli", "viis"])
s
Väljund:
üks 1
kaks 2
kolm 3
neli 4
viis 5
dtype: int64
Kuidas sõnaraamatu abil sarja luua
Sõnaraamatu võtmetest saavad sarja sildid.
d = {"üks": 1,
"kaks": 2,
"kolm": 3,
"neli": 4,
"viis": 5}
s = pd. Seeria (d)
s
Väljund:
üks 1
kaks 2
kolm 3
neli 4
viis 5
dtype: int64
Kuidas luua seeriat skalaarväärtuse abil
Kui soovite luua seeria, kasutades skalaarväärtust, peate esitama indeks argument.
s = pd. Seeria (1, indeks = ["a", "b", "c", "d"])
s
Väljund:
a 1
b 1
c 1
d 1
dtype: int64
3. Kuidas Pandas andmeraami luua
DataFrame on kahemõõtmeline andmestruktuur, kus andmed on joondatud ridade ja veergude kujul. DataFrame'i saab luua sõnastike, loendite, sõnaraamatute loendi, numpy massiivide jne abil. Reaalses maailmas luuakse DataFrame'id, kasutades olemasolevat salvestusruumi, näiteks CSV-faile, Exceli faile, SQL-i andmebaase jne.
DataFrame'i objekt toetab mitmeid atribuute ja meetodeid. Kui soovite nende kohta rohkem teada saada, võite tutvuda ametliku dokumentatsiooniga panda andmeraamistik.
Kuidas luua tühja andmeraami
df = pd. DataFrame()
print (df)
Väljund:
Tühi DataFrame
Veerud: []
Indeks: []
Kuidas luua DataFrame'i loendi abil
listObj = ["MUO", "tehnoloogia", "lihtsustatud"]
df = pd. DataFrame (listObj)
print (df)
Väljund:
0
0 MUO
1 tehnoloogia
2 lihtsustatud
DataFrame'i loomine ndarray/nimekirjade sõnastiku abil
batmanData = {'Filmi nimi': ['Batman Begins', "The Dark Knight", "The Dark Knight Rises"],
"Väljalaskmise aasta": [2005, 2008, 2012]}
df = pd. DataFrame (batmanData)
print (df)
Väljund:
Filmi nimi Ilmumisaasta
0 Batman alustab 2005
1 Pimeduse rüütel 2008
2 The Dark Knight Rises 2012
Kuidas luua DataFrame'i loendite loendi abil
andmed = [['Alex', 601], ['Bob', 602], ['Cataline', 603]]
df = pd. DataFrame (andmed, veerud = ['nimi', 'rulli nr'])
print (df)
Väljund:
Nimerull nr.
0 Alex 601
1 Bob 602
2 Kataliin 603
Kuidas luua DataFrame'i sõnaraamatute loendi abil
data = [{'Nimi': 'Alex', 'Rulli nr': 601},
{'Nimi': 'Bob', 'Rull nr': 602},
{'Nimi': 'Cataline', 'Rull nr': 603}]
df = pd. DataFrame (andmed)
print (df)
Väljund:
Nimerull nr.
0 Alex 601
1 Bob 602
2 Kataliin 603
Seotud: Kuidas teisendada loend Pythonis sõnaraamatuks
DataFrame'i loomine zip() funktsiooni abil
Kasuta zip() funktsioon loendite liitmiseks Pythonis.
Nimi = ['Alex', 'Bob', 'Cataline']
RollNo = [601, 602, 603]
listOfTuples = loend (zip (nimi, RollNo))
df = pd. DataFrame (listOfTuples, columns = ['nimi', 'rulli nr'])
print (df)
Väljund:
Nimerull nr.
0 Alex 601
1 Bob 602
2 Kataliin 603
4. Kuidas lugeda Pandas CSV-andmeid
CSV-fail on piiritletud tekstifail, mis kasutab väärtuste eraldamiseks koma. Saate lugeda CSV-faili kasutades read_csv() meetod pandadel. Kui soovite printida kogu DataFrame'i, kasutage to_string() meetod.
Selles ja järgmistes näidetes see CSV-fail kasutatakse operatsioonide läbiviimiseks.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.to_string())
Väljund:
5. Andmeraamide analüüsimine head(), tail() ja info() meetodite abil
Kuidas vaadata andmeid pea() meetodi abil
The pea () meetod on üks parimaid viise DataFrame'ist kiire ülevaate saamiseks. See meetod tagastab päise ja määratud arvu ridu, alustades ülaosast.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.head (10))
Väljund:
Kui te ridade arvu ei määra, tagastatakse esimesed 5 rida.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.head())
Väljund:
Kuidas vaadata andmeid tail() meetodi abil
The saba () meetod tagastab päise ja määratud arvu ridu, alustades alt.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.tail (10))
Väljund:
Kui te ridade arvu ei määra, tagastatakse viimased 5 rida.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.tail())
Väljund:
Kuidas saada teavet andmete kohta
The info() meetodid tagastavad DataFrame'i lühikokkuvõtte, sealhulgas indeksi dtype ja veeru dtyped, mitte-null väärtused ja mälukasutuse.
df = pd.read_csv(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/biostats.csv')
print (df.info())
Väljund:
6. Kuidas lugeda Pandas JSON-andmeid
JSON (JavaSkriips Oobjekt Notation) on kerge andmevahetusvorming. JSON-faili saate lugeda, kasutades read_json() meetod pandadel. Kui soovite printida kogu DataFrame'i, kasutage to_string() meetod.
Allolevas näites on see JSON-fail kasutatakse toimingute tegemiseks.
Seotud: Mis on JSON? Võhiku ülevaade
df = pd.read_json(' https://raw.githubusercontent.com/Yuvrajchandra/Basic-Operations-Using-Pandas/main/google_markers.json')
print (df.to_string())
Väljund:
Värskendage oma Pythoni teadmisi sisseehitatud funktsioonide ja meetodite abil
Funktsioonid aitavad lühendada teie koodi ja parandada selle tõhusust. Funktsioonid ja meetodid nagu vähenda (), split (), loetlema (), eval(), ümmargune (), jne. võib muuta teie koodi tugevaks ja hõlpsasti mõistetavaks. Sisseehitatud funktsioonide ja meetodite kohta on alati hea teada, kuna need võivad teie programmeerimisülesandeid suurel määral lihtsustada.
Pythoni standardteek sisaldab palju funktsioone, mis aitavad teie programmeerimisülesandeid täita. Lugege kõige kasulikumate kohta ja looge tugevam kood.
Loe edasi
- Programmeerimine
- Python
- Veebiarendus
- Programmeerimine
- Andmete analüüs
Yuvraj on India Delhi ülikooli arvutiteaduse bakalaureuseõppe üliõpilane. Ta on kirglik Full Stack veebiarendusse. Kui ta ei kirjuta, uurib ta erinevate tehnoloogiate sügavust.
Liituge meie uudiskirjaga
Liituge meie uudiskirjaga tehniliste näpunäidete, arvustuste, tasuta e-raamatute ja eksklusiivsete pakkumiste saamiseks!
Tellimiseks klõpsake siin