Pivot-tabelid on jätkuvalt MS Exceli kõige austatud ja laialdasemalt kasutatavad tööriistad. Olenemata sellest, kas olete andmeanalüütik, andmeinsener või lihtsalt tavaline kasutaja, on tõenäoline, et teil on MS Exceli jaoks juba pehme koht.

Sellegipoolest on MS Exceli tööriistade ja utiliitide paljundamiseks üha rohkem võimalusi, eriti Pythonis. Kas teadsite, et saate Pythoni DataFramesis luua ulatuslikke pivot-tabeleid mõne koodireaga?

Jah, see on õige; kui olete huvitatud, saate seda teha järgmiselt.

Pivot-tabelite loomise eeltingimused

Nagu iga teine ​​programmeerimiskeel, peab isegi Python enne kodeerimisega tegelemist täitma mõned eeltingimused.

Kõige optimeeritud kogemuse saamiseks Pythonis oma esimese pivot-tabeli loomisel vajate järgmist.

  • Python IDE: Enamikul Pythoni koodidel on nende süsteemi eelinstallitud integreeritud arenduskeskkond (IDE). Neid on mitu Pythoniga ühilduvad IDE-d turul, sealhulgas Jupyter Notebook, Spyder, PyCharm ja paljud teised.
  • Näidisandmed: Illustreerimiseks on siin näidisandmekogum, millega saate edasi töötada. Teise võimalusena saate neid koode otse oma reaalajas andmetes kohandada.
    instagram viewer

Andme näidislink:Superpoe näidis

Oluliste teekide importimine

Kuna Python töötab kolmanda osapoole teekide kontseptsioonil, peate importima Pandad teek pöördepunktide loomiseks.

Pandasid saate kasutada selleks importige Exceli fail Pythoni ja salvestage andmed DataFrame'i. Pandade importimiseks kasutage importida käsk järgmisel viisil:

importida pandad nagu pd

Kuidas Pythonis pöördeid luua

Kuna teek on nüüd saadaval, peate importima Exceli faili Pythoni, mis on Pythonis pöördepunktide loomise ja testimise aluseks. Salvestage imporditud andmed järgmise koodiga DataFrame'i:

# Looge uus DataFrame
# asendage siin oma teega
tee = "C://Users//user/OneDrive//Desktop//"
# siin saate määrata failinime
fail = "Näidis – Superstore.xls"
df = pd.read_excel (tee + fail)
df.pea()

Kus:

  • df: Muutuja nimi DataFrame'i andmete salvestamiseks
  • pd: Pandase raamatukogu varjunimi
  • read_excel(): Panda funktsioon Exceli faili lugemiseks Pythoni
  • tee: Exceli faili salvestamise koht (Sample Superstore)
  • faili: imporditava faili nimi
  • pea (): Vaikimisi kuvab DataFrame'i esimesed viis rida

Ülaltoodud kood impordib Exceli faili Pythoni ja salvestab andmed DataFrame'i. Lõpuks, pea funktsioon kuvab esimesed viis andmerida.

See funktsioon on mugav tagamaks, et andmed imporditakse Pythoni õigesti.

Millised Pivot-tabeli väljad on Pythonis olemas?

Nagu Exceli vastel, on ka pöördetabelil Pythonis sarnane väljade komplekt. Siin on mõned väljad, mida peate teadma.

  • Andmed: Andmeväli viitab Python DataFrame'i salvestatud andmetele
  • Väärtused: Pivoti sees kasutatavad veeruandmed
  • Indeks: Indeksi veerg (veerud) andmete rühmitamiseks
  • Veerud: Veerud aitavad koondada olemasolevaid andmeid DataFrame'i

Indeksifunktsiooni kasutamise eesmärk

Kuna indeksifunktsioon on liigendtabeli esmane element, tagastab see andmete põhipaigutuse. Teisisõnu saate oma andmed rühmitada indeks funktsiooni.

Oletame, et soovite näha jaotises loetletud toodete koondväärtusi Segment veerg. Eelmääratletud koondväärtuse (keskväärtuse) saate Pythonis arvutada, määrates kindlaks määratud veerud anindeksi väärtusena.

df.pivot_table (indeks = "Segment")

Kus:

  • df:andmeid sisaldav DataFrame
  • pivot_table:Pivot tabeli funktsioon Pythonis
  • indeks: sisseehitatud funktsioon veeru indeksina määratlemiseks
  • Segment: indeksi väärtusena kasutatav veerg

Pythoni muutujate nimed on tõstutundlikud, seega vältige selles juhendis loetletud eelmääratletud muutujate nimedest loobumist.

Kuidas kasutada mitme indeksi väärtusi

Kui soovite kasutada mitut indeksi veergu, saate veergude nimed määrata jaotises a nimekirja indeksi funktsiooni sees. Kõik, mida pead tegema, on määrata veergude nimed komplektis nurksulud ([ ]), nagu allpool näidatud:

df.pivot_table (indeks = ["Kategooria", "Alamkategooria"])

Pöördfunktsioon taandab väljundis indeksi veeru. Python kuvab tähendab kõigist arvväärtustest iga indeksi väärtuse suhtes.

Õppige väljundis väärtusi piirama

Kuna Python valib vaikimisi kõik numbrilised veerud, saate lõppväljundis kuvatavate tulemuste muutmiseks väärtusi piirata. Kasuta väärtused funktsiooni veergude määratlemiseks, mida soovite näha.

df.pivot_table (indeks = ["Piirkond", "Kategooria", "Alamkategooria"], väärtused = "Müük")

Lõppväljundis on kolm indeksi veergu ja müügi veeru keskmised väärtused on iga elemendi taustal.

Koondfunktsioonide määratlemine Pivot Tabelis

Mis juhtub, kui te ei soovi vaikimisi keskmisi väärtusi arvutada? Pivot-tabelil on palju muid funktsioone, mis ei piirdu lihtsa keskmise arvutamisega.

Koodi kirjutamiseks tehke järgmist.

df.pivot_table (indeks = ["Kategooria"], väärtused = "Müük", aggfunc = [summa, max, min, len])

Kus:

  • summa: Arvutab väärtuste summa
  • max: Arvutab maksimaalse väärtuse
  • min: Arvutab maksimaalse väärtuse
  • len: Arvutab väärtuste arvu

Kõik need funktsioonid saate määratleda ka eraldi koodiridades.

Kuidas liittabelisse lõppsummasid lisada

Ükski andmevara pole täielik ilma lõppsummadeta. Andmeveeru lõppsummade arvutamiseks ja kuvamiseks kasutage marginaalid ja marginaalid_nimi funktsiooni.

df.pivot_table (indeks = ["Kategooria"], väärtused = "Müük", aggfunc = [summa, max, min, len], margins=True, margins_name='Suured summad')

Kus:

  • marginaalid: Funktsioon lõppsumma arvutamiseks
  • margins_name: Määrake indeksi veerus kategooria nimi (nt üldsummad)

Muutke ja kasutage lõppkoodi

Siin on koodi lõplik kokkuvõte:

importida pandad nagu pd
# asendage siin oma teega
tee = "C://Users//user/OneDrive//Desktop//"
# siin saate määrata failinime
fail = "Näidis – Superstore.xls"
df = pd.read_excel (tee + fail)
df.pivot_table (indeks = ["Piirkond", "Kategooria", "Alamkategooria"], väärtused = "Müük",
aggfunc = [summa, max, min, len],
marginaalid=Tõsi,
margins_name='Suured summad')

Pivot-tabelite loomine Pythonis

Pivot-tabelite kasutamisel on valikud lihtsalt lõputud. Python võimaldab teil hõlpsasti hallata suuri andmemassiivid, muretsemata andmete lahknevuste ja süsteemi viivituste pärast.

Kuna Pythoni funktsioonid ei piirdu ainult andmete tihendamisega pöördepunktideks, saate kombineerida mitu Exceli töövihikut ja -lehte, täites samal ajal Pythoniga seotud funktsioone.

Pythoniga on alati midagi uut silmapiiril.