Python kui keel on mõõtmatult väärtuslik, eriti kui soovite töötada struktureeritud andmetega. Kuna inimesed salvestavad Exceli failidesse palju andmeid, on aja ja vaeva säästmiseks hädavajalik ühendada mitu faili.
Python võimaldab teil seda täpselt teha; olenemata sellest, kui palju Exceli faile soovite kombineerida, saate seda teha suhteliselt lihtsalt. Arvestades selle teeke ja kolmandate osapoolte ressursse, saate oma pakkumise tegemiseks importida ja kasutada Pythoni mitmekülgseid tööriistu.
Selles juhendis peate installima ja kasutama Pandase teeke, et importida andmed Pythoni enne nende konsolideerimist.
Installige Pythonis Panda raamatukogud
Pandas on kolmanda osapoole teek, mille saate Pythonis installida. Mõnel IDE-l on Pandad juba installitud.
Kui kasutate a IDE versioon millega ei ole kaasas eelinstallitud Pandasid, võite olla kindel, saate installida selle otse Pythoni.
Pandade installimiseks tehke järgmist.
pip install pandad
Kui kasutate Jupyteri sülearvutit, saate installida Pandad otse rakendusega
PIP käsk. Enamasti, kui olete installinud Jupyteri koos Anacondaga, on suur tõenäosus, et Pandad on juba otseseks kasutamiseks saadaval.Kui te ei saa Pandadele helistada, saate nende otse installimiseks kasutada ülaltoodud käsku.
Exceli failide kombineerimine Pythoniga
Esiteks peate kõigi Exceli failidega oma eelistatud asukohta looma kausta. Kui kaust on valmis, võite alustada teekide importimiseks koodi kirjutamist.
Selles koodis kasutate kahte muutujat:
- Pandad: Pandase teek pakub andmeraamid Exceli failide salvestamiseks.
- OS: Teek on kasulik andmete lugemiseks teie masina kaustast
Nende teekide importimiseks kasutage järgmisi käske:
Impordi Pandad pd-na
Import OS
- Import: Pythoni süntaks, mida kasutatakse Pythoni teekide importimiseks
- Pandad: Raamatukogu nimi
- pd: Raamatukogule antud alias
- OS: Teek süsteemikaustale juurdepääsuks
Kui olete teegid importinud, looge sisend- ja väljundfaili tee salvestamiseks kaks muutujat. Failide kausta juurde pääsemiseks on vaja sisendfaili teed. Väljundfaili tee on vajalik, kuna kombineeritud fail eksporditakse sinna.
Kui kasutate Pythonit, muutke kindlasti kaldkriips edasi-kaldkriipsuks (\ juurde /)
input_file_path = "C:/Kasutajad/gaurav/OneDrive/Desktop/Excel-failid/"
output_file_path = "C:/Kasutajad/gaurav/OneDrive/Desktop/"
Lisage / lõpus ka radade lõpetamiseks.
Kausta failid on saadaval loendis. Looge loend, et salvestada sisendkausta kõik failiviited, kasutades loendikataloog funktsioonist OS raamatukogu.
Kui te pole kindel teegis saadaolevate funktsioonide osas, võite kasutada rež funktsioon teegi nimega. Näiteks funktsiooni listdir täpse versiooni kontrollimiseks võite kasutada käsku järgmiselt:
dir (OS)
Väljund koosneb kõigist OS-i teegis saadaolevatest seotud funktsioonidest. Funktsioon listdir on üks paljudest selles teegis saadaolevatest funktsioonidest.
Looge kausta sisendfailide salvestamiseks uus muutuja.
excel_file_list = os.listdir (sisendfaili_tee)
Printige see muutuja, et näha kaustas salvestatud failide nimesid. Pärast printimisfunktsiooni kasutamist kuvatakse kõik kaustas salvestatud failid.
print (exceli_failide_loend)
Järgmiseks peate iga Exceli faili salvestamiseks lisama uue andmeraami. Kujutage ette andmeraami kui konteinerit andmete salvestamiseks. Siin on käsk andmeraami loomiseks.
df = pd. DataFrame()
- df: Muutuja DataFrame'i väärtuse salvestamiseks
- pd: Pseudonüüm Panda raamatukogu
- Andmeraam: Andmeraami lisamise vaikesüntaks
Sisestuskaustas on kolm .xlsx failid selles näites. Failide nimed on:
Fail1_excel.xlsx
Fail2_excel.xlsx
Fail3_excel.xlsx
Iga faili avamiseks sellest kaustast peate käivitama tsükli. Silmus käitatakse kõigi ülaltoodud loendis olevate failide puhul.
Seda saate teha järgmiselt.
Exceli_failide jaoks loendis excel_file_list:
Järgmisena on vaja kontrollida failide laiendusi, kuna kood avab ainult XLSX-faile. Nende failide kontrollimiseks võite kasutada Kui avaldus.
Kasuta lõpeb funktsioon sel eesmärgil järgmiselt:
Exceli_failide jaoks loendis excel_file_list:
if excel_files.endswith(.xlsx"):
- excel_files: Loetelu kõigi failiväärtustega
- lõpeb: Funktsioon failide laienduse kontrollimiseks
- (.xlsx"): See stringi väärtus võib muutuda olenevalt sellest, mida soovite otsida
Nüüd, kui olete Exceli failid tuvastanud, saate failide eraldi lugemiseks ja salvestamiseks luua uue andmeraami.
Exceli_failide jaoks loendis excel_file_list:
if excel_files.endswith(.xlsx"):
df1 = pd.read_excel (sisendfaili_tee+exceli_failid)
- df1: Uus andmeraam
- pd: Panda raamatukogu
- read_excel: Funktsioon Exceli failide lugemiseks Pandase teegis
- input_file_path: Selle kausta tee, kuhu failid on salvestatud
- excel_files: Iga muutuja, mida kasutatakse for-tsüklis
Failide lisamise alustamiseks peate kasutama lisama funktsiooni.
Exceli_failide jaoks loendis excel_file_list:
if excel_files.endswith(.xlsx"):
df1 = pd.read_excel (sisendfaili_tee+exceli_failid)
df = df.lisa (df1)
Lõpuks, nüüd, kui koondandmete raam on valmis, saate selle eksportida väljundi asukohta. Sel juhul ekspordite andmeraami XLSX-faili.
df.to_excel (output_file_path+"Consolidated_file.xlsx")
- df: Eksporditav andmeraam
- to_excel: Andmete eksportimiseks kasutatav käsk
- output_file_path: Väljundi salvestamiseks määratud tee
- Consolidated_file.xlsx: Konsolideeritud faili nimi
Vaatame nüüd lõplikku koodi:
#Pandast kasutatakse andmeraamina Exceli failide käsitlemiseks
importida pandad pd-na
import os# muutke kaldkriips "\" asemel "/", kui kasutate Windowsi seadmeid
input_file_path = "C:/Kasutajad/gaurav/OneDrive/Desktop/Excel-failid/"
output_file_path = "C:/Kasutajad/gaurav/OneDrive/Desktop/"#loo loend, et salvestada kõik sisendkausta failiviited, kasutades OS-i teegi funktsiooni listdir.
#Teegi sisu vaatamiseks (nagu funktsiooni listdir, saate kasutada teegi nimes olevat funktsiooni dir).
#Kasutage sisu loetlemiseks kausta (teegi_nimi).excel_file_list = os.listdir (sisendfaili_tee)
#prindige pärast loendi määratlemist kõik kaustas salvestatud failid
excel_file_list#Kui iga fail avaneb, kasutage lisamisfunktsiooni, et alustada mitmesse faili salvestatud andmete koondamist
#looge Exceli failide importimiseks uus tühi andmeraam
df = pd. DataFrame()#Käivita tsükkel, et läbida loendi iga faili
Exceli_failide jaoks loendis excel_file_list:
#kontrollige ainult .xlsx-liitefaile
if excel_files.endswith(.xlsx"):
#loo uus andmeraam, et lugeda/avada iga Exceli fail ülaltoodud failide loendist
df1 = pd.read_excel (sisendfaili_tee+exceli_failid)
#lisada iga fail algsesse tühja andmeraami
df = df.lisa (df1)
#kandke lõplik väljund väljundteel Exceli (xlsx) faili
df.to_excel (output_file_path+"Consolidated_file.xlsx")
Pythoni kasutamine mitme Exceli töövihiku ühendamiseks
Pythoni Pandas on suurepärane tööriist nii algajatele kui ka edasijõudnutele. Teeki kasutavad laialdaselt arendajad, kes soovivad Pythoni meisterdada.
Isegi kui olete algaja, saate Pandade nüanssidest ja Pythonis raamatukogu kasutamisest palju kasu.
Nende algajate toimingute abil saate Pandadest osa saada.
Loe edasi
- Programmeerimine
- Python
- Microsoft Excel
- Arvutustabel
Gaurav Siyal on kaheaastane kirjutamiskogemus, kirjutades mitmetele digitaalse turunduse ettevõtetele ja tarkvara elutsükli dokumentidele.
Liituge meie uudiskirjaga
Liituge meie uudiskirjaga tehniliste näpunäidete, arvustuste, tasuta e-raamatute ja eksklusiivsete pakkumiste saamiseks!
Tellimiseks klõpsake siin