Instagram on miljardite kasutajatega üks populaarsemaid sotsiaalmeedia saite. Kõigil õpilastest kuulsusteni on Instagrami konto. Instagrami avalikud andmed võivad olla ettevõtetele, turundajatele ja üksikisikutele tohutult väärtuslikud. Igaüks saab neid andmeid kasutada andmete analüüsimiseks, sihtturunduseks ja ülevaate saamiseks.

Pythoni abil saate luua automatiseeritud tööriista, mis ekstraheerib Instagrami andmeid.

Nõutavate teekide installimine

Installilaadur on Pythoni teek, mida saate kasutada avalikult kättesaadavate andmete eraldamiseks Instagramist. Saate juurdepääsu andmetele, nagu pildid, videod, kasutajanimi, nr. postitusi, jälgijate arv, jälgijate arv, biograafia jne. kasutades Instaloaderit. Pange tähele, et Instaloader ei ole mingil viisil Instagramiga seotud, volitatud, hooldatud ega toetatud.

Instaloaderi installimiseks pipi kaudu käivitage järgmine käsk:

pip installida paigaldaja

Sul peab olema pip teie süsteemi installitud väliste Pythoni teekide installimiseks.

Järgmiseks peate installima Pandas Pythoni raamatukogu. Pandas on Pythoni teek, mida kasutatakse peamiselt andmetega manipuleerimiseks ja andmete analüüsimiseks. Selle installimiseks käivitage järgmine käsk:

pip installida pandad

Nüüd olete valmis alustama koodi seadistamist ja andmete toomist Instagramist.

Koodi seadistamine

Instagrami andmete toomise tööriista seadistamiseks peate importima Instaloader Pythoni teegi ja looma Instaloaderi klassi eksemplari. Pärast seda peate esitama selle profiili Instagrami käepideme, millest soovite andmed eraldada.

Instagram Extractor Pythoni kood on saadaval a GitHubi hoidla ja seda saate MIT-i litsentsi alusel tasuta kasutada.

importida paigaldaja

# Instaloaderi klassi eksemplari loomine
bot = installilaadur. Instaloader ()

# Profiili laadimine Instagrami käepidemest
profiil = installer. Profile.from_username (bot.context, 'cristiano')
printida(profiil)

See on hea esimene samm põhitõdede kontrollimiseks. Peaksite nägema olulisi andmeid ilma vigadeta:

Andmete ekstraheerimine profiilist

Saate eraldada väärtuslikke avalikult kättesaadavaid andmeid, nagu kasutajanimi, nr. postituste arv, jälgijate arv, jälgijate arv, biograafia, kasutaja ID ja väline URL, kasutades Instaloaderit vaid mõne koodireaga. Peate esitama ainult profiili Instagrami käepideme.

importida paigaldaja
importida pandad nagu pd

# Instaloaderi klassi eksemplari loomine
bot = installilaadur. Instaloader ()

# Profiili laadimine Instagrami käepidemest
profiil = installer. Profile.from_username (bot.context, 'leomessi')
print("Kasutajanimi: ", profile.username)
print("Kasutaja ID: ", profile.userid)
print("Postituste arv: ", profile.mediacount)
print("Jälgijate arv: ", profile.followers)
print("Järgmine loendus: ", profile.followees)
print("Bio: ", profile.biography)
print("Väline URL: ", profile.external_url)

Peaksite nägema määratud käepidemest palju profiiliteavet:

Meilide ekstraheerimine biost

Saate e-posti aadresse ekstraheerida mis tahes profiili Insta biost regulaaravaldised. Peate importima Pythoni re teeki ja edastage regulaaravaldis e-posti kinnitamiseks parameetrina re.findall() meetod:

importida paigaldaja
importida re
# Instaloaderi klassi eksemplari loomine
bot = installilaadur. Instaloader ()
profiil = installer. Profile.from_username (bot.context, "rikkust")
print("Kasutajanimi: ", profile.username)
print("Bio: ", profile.biography)
meilid = re.findall (r"\b[A-Za-z0-9._%+-]+@[A-Za-z0-9.-]+\.[A-Z|a-z]{2,}\b", profile.biography)
print("E-kirjad ekstraktitud alates biograafia:")
printida(e-kirjad)

Skript prindib kõik, mille ta biograafias e-posti aadressina tuvastab:

Populaarseimate otsingutulemuste andmete ekstraheerimine

Kui otsite Instagramist midagi, saate mitmeid tulemusi, sealhulgas kasutajanimesid ja hashtage. Parimad otsingutulemused saate ekstraktida, kasutades hanki_profiilid() ja get_hashtags() meetodid. Peate sisestama ainult otsingupäringu paigaldaja. TopSearchResults() meetod. Lisaks saate üksikuid tulemusi korrata ja printida/salvestada.

importida paigaldaja

# Instaloaderi klassi eksemplari loomine
bot = installilaadur. Instaloader ()

# Esitage siin otsingupäring
search_results = installilaadur. TopSearchResults (bot.context, 'muusika')

# Ekstraheeritud kasutajanimede itereerimine
jaokskasutajanimisisseOtsingu tulemused.get_profiles():
printida(kasutajanimi)

# Ekstraheeritud hashtagide itereerimine
jaokshashtagsisseOtsingu tulemused.get_hashtags():
printida(räsimärk)

Väljund sisaldab kõiki sobivaid kasutajanimesid ja hashtage:

Konto jälgijate ja jälgimiste eraldamine

Instaloaderi abil saate eraldada konto jälgijad ja need, mida see ise jälgib. Nende andmete toomiseks peate esitama Instagrami kasutajanime ja parooli.

Ärge kunagi kasutage Instagramist andmete eraldamiseks oma isiklikke kontosid, kuna see võib teie konto ajutiselt või jäädavalt keelata.

Pärast Instaloaderi klassi eksemplari loomist peate sisestama oma kasutajanime ja parooli. Seda selleks, et bot saaks teie kontoga Instagrami sisse logida ning jälgida jälgijate ja jälgijate andmeid.

Järgmisena peate esitama sihtprofiili Instagrami käepideme. The get_followers() ja get_followees() meetodid eraldavad järgijad ja järgijad. Jälgijate ja jälgijate kasutajanimed saate hankida kasutades jälgija.kasutajanimi ja followee.username omadused vastavalt.

Kui soovite salvestada tulemused CSV-faili, peate esmalt teisendama andmed Pandas DataFrame'i objektiks. Kasuta pd. DataFrame() meetod loendiobjekti teisendamiseks DataFrame'iks.

Lõpuks saate DataFrame'i objekti eksportida CSV-faili, kasutades to_csv() meetod. Peate läbima failinimi.csv selle meetodi parameetrina, et saada eksporditud andmed CSV-failivormingus.

Kõiki jälgijaid ja jälgijaid näevad ainult konto omanikud. Selle või mõne muu meetodi abil ei saa te kõiki jälgijate ja jälgijate andmeid ekstraktida.

# Teekide importimine
importida paigaldaja
importida pandad nagu pd

# Instaloaderi klassi eksemplari loomine
bot = installilaadur. Instaloader ()
bot.login (kasutaja="Sinu kasutajanimi", passwd="Teie_parool")

# Profiili laadimine Instagrami käepidemest
profiil = installer. Profile.from_username (bot.context, 'Your_target_account_insta_handle')

# Kõigi jälgijate kasutajanimede hankimine
followers = [follower.username jälgija jaoks profiilis.get_followers()]

# Andmete teisendamine DataFrame'iks
Followers_df = pd. DataFrame (jälgijad)

# Tulemuste salvestamine CSV-faili
followers_df.to_csv('jälgijad.csv', indeks = vale)

# Kõigi järgnevate kasutajanimede toomine
followings = [followee.kasutajanimi jälgijale profiilis.get_followees()]

# Andmete teisendamine DataFrame'iks
followings_df = pd. DataFrame (järgmised)

# Tulemuste salvestamine CSV-faili
follows_df.to_csv('follows.csv', indeks = vale)

Laadige postitused alla Instagrami kontolt

Jällegi, mis tahes kontolt postituste allalaadimiseks peate sisestama kasutajanime ja parooli. Seda tehakse selleks, et robot saaks teie kontoga Instagrami sisse logida. Saate kõik postituste andmed alla laadida, kasutades hanki_postitused() meetod. Ja saate kõiki üksikuid postitusi korrata ja alla laadida, kasutades download_post() meetod.

# Teekide importimine
importida paigaldaja
importida pandad nagu pd

# Looge Instaloaderi klassi eksemplar
bot = installilaadur. Instaloader ()
bot.login (kasutaja="Sinu kasutajanimi",passwd="Teie_parool")

# Profiili laadimine Instagrami käepidemest
profiil = installer. Profile.from_username (bot.context, 'Your_target_account_insta_handle')

# Objekti kõigi postituste toomine
postitused = profile.get_posts()

# Kõigi üksikute postituste itereerimine ja allalaadimine
indeksi jaoks postita loendisse (postitused, 1):
bot.download_post (post, target=f"{profiil.kasutajanimi_{index}")

Kraapige veebi Pythoni abil

Andmete kraapimine või veebikraapimine on üks levinumaid viise veebist kasuliku teabe hankimiseks. Väljavõttud andmeid saate kasutada turunduseks, sisuloomeks või otsuste tegemiseks.

Python on eelistatud keel andmete kraapimiseks. Teegid nagu BeautifulSoup, Scrapy ja Pandas lihtsustavad andmete ekstraheerimist, analüüsi ja visualiseerimist.