Internet Movie Database (IMDb) on suurim veebipõhine andmebaas, mis sisaldab teavet filmide, teleseriaalide, koduvideote, videomängude ja voogesituse kohta. Veebipõhine andmebaas sisaldab miljoneid täpseid kirjeid, mida saate andmete analüüsimiseks kasutada.

Cinemagoer (varem tuntud kui IMDbPY) on Pythoni teek IMDb filmide andmebaasi andmete haldamiseks ja toomiseks. Saate juurdepääsu andmetele filmide, inimeste ja ettevõtete kohta, mida saab analüüsimiseks edasi kasutada.

Nõutavate teekide installimine

Peate installima kinokülastaja Pythoni raamatukogu juurdepääsuks IMDb andmebaasi. Teegi installimiseks käivitage käsureal järgmine käsk:

pip installida kinokülastaja

Sul peab olema pip teie süsteemi installitud väliste Pythoni teekide installimiseks.

Selles projektis kasutatav kood on saadaval a GitHubi hoidla ja seda saate MIT-i litsentsi alusel tasuta kasutada.

IMDb andmete ekstraheerimine Pythoni abil

Enne selle koodis kasutamist peate importima kinokülastaja raamatukogu.

alates imdb importida Kinokülastaja
ia = Kinokülastaja()
instagram viewer

Ülaltoodud kood impordib kinokülastajate teegi ja loob kinokülastajate klassi eksemplari.

Filmide otsimine

Saate otsida antud (või sarnase) pealkirjaga filme kasutades search_movie() meetod. Näiteks kui soovite otsida filme pealkirjaga "rock", peate käivitama järgmise koodi:

alates imdb importida Kinokülastaja

# Cinemagoer klassi eksemplari loomine
ia = Kinokülastaja()

# Otsin filme, mille nimes on rokk
filmid = ia.search_movie('kivi')
printida(filmid[0])

See peaks välja printima esimese leitud filmi, näiteks:

Filmi saate hankida selle IMDb ID järgi. Seejärel saate ekstraheerida lisateavet, nagu režissööride nimed ja žanrid. Sa pead loendit sirvida individuaalse teabe saamiseks.

alates imdb importida Kinokülastaja

# Cinemagoer klassi eksemplari loomine
ia = Kinokülastaja()

# Filmi hankimine IMDb ID abil
film = ia.get_movie('0468569')
printida(Film)

# Filmi režissööride nimede trükkimine
print('Režissöörid:')

režissöörile filmis['lavastajad']:
print (direktor['nimi'])

# filmi žanrite trükkimine
print('Žanrid:')

žanri jaoks filmis['žanrid']:
printida(žanr)

Väljundis peaksite nägema antud filmi nime, selle režissööri (režissööre) ja žanrit:

Inimese otsimine

Saate otsida inimesi kasutades search_person() meetod. Näiteks kui soovite otsida sõna "Heath", peate käivitama järgmise koodi:

alates imdb importida Kinokülastaja

# Cinemagoer klassi eksemplari loomine
ia = Kinokülastaja()

# Otsin inimesi, kelle nimes on Heath
isikud = ia.search_person('Heath')
printida(isikud[0])

Näete esimese otsinguga leitud isiku nime:

Firmade otsimine

Ettevõtteid saate otsida kasutades otsing_ettevõte() meetod. Näiteks kui soovite otsida sõna "Universaalne", peate käivitama järgmise koodi:

alates imdb importida Kinokülastaja

# Cinemagoer klassi eksemplari loomine
ia = Kinokülastaja()

# Otsin ettevõtteid, mille nimes on Universal
ettevõtted = ia.search_company('Universaalne')
printida(ettevõtted)

Saate nimekirja kõigist ettevõtetest, mille nimi on Universal.

Samuti saate isiku ja ettevõtte andmeid selle ID abil hankida.

alates imdb importida Kinokülastaja

# Cinemagoer klassi eksemplari loomine
ia = Kinokülastaja()

# Isikuandmete hankimine ID abil
isik = ia.get_person('0005132')
print (person['nimi'])
print (person['sünnikuupäev'])

# Ettevõtte andmete hankimine ID järgi
ettevõte = ia.get_company('0005073')
print (firma['nimi'])

Väljund näitab isiku üksikasju ja ettevõtte nime:

Populaarsete ja alumiste filmide leidmine

Saate hankida 250 populaarseima ja 100 alumise filmi andmeid kasutades get_top250_movies() ja get_bottom100_movies() meetodid, vastavalt:

alates imdb importida Kinokülastaja

# Cinemagoer klassi eksemplari loomine
ia = Kinokülastaja()

# 250 parima filmi leidmine
top = ia.get_top250_movies()
printida(ülemine[0])

# 100 alumise filmi leidmine
alumine = ia.get_bottom100_movies()
printida(alt[0])

Vastuseks näete parima filmi nime ja halvima filmi nime:

Kinokülastaja raamatukogu pakub ka muid meetodeid, nagu get_top250_tv(), get_popular100_movies(), ja get_top250_indian_movies().

Andmeanalüüs on andmete hindamine, kasutades teabe hankimiseks analüütilisi või statistilisi vahendeid. Andmeanalüüsi populaarsus kasvab iga päevaga. Nüüd kasutavad seda ettevõtted, turundusettevõtted ja spordimeeskonnad. Andmeanalüütika täielik protsess hõlmab eesmärkide määratlemist, küsimuste esitamist, andmete kogumist, andmete puhastamist, andmete analüüsi ja tulemuste kokkuvõtmist.

Saate hankida oma projektide jaoks andmekogumeid Pythoni teekide (nt Cinemagoer) või veebiplatvormide (nt Kaggle) kaudu. Lisaks täiskeeltele, nagu Python ja R, saate andmete analüüsimiseks kasutada muid tööriistu, nagu Microsoft Excel, Tableau ja Stata.