Masinõppest on tänapäeval saanud tehisintellekti arutelu keskpunkt. See puudutab kõiki valdkondi, sealhulgas inseneriteadust, meditsiini, äri, sotsiaalteadusi ja palju muud.

Kasutades mitut tänapäeval saadaolevat masinõppe teeki, on masinõpe muu hulgas Pythoni, C ++, Java, Julia ja R abil lihtsam kui kunagi varem. Siin on mõned populaarsed masinõppe raamatukogud, millest saate alustada, kui soovite sellel paljutõotaval karjääriteel asuda.

1. Keras

Keras on osa TensorFlow ulatuslikest masinõppe utiliitidest. Kuid see erineb selle poolest, et see on kõrgema taseme API, mis tarnitakse koos TensorFlow'ga. Lisaks on see inimsõbralikum ja kirjutatud Pythoni abil. Seega on see rakendatavam, kuna pakub lühidokumentatsiooni, mida on masinõppega algajatel lihtne kitsendada.

Keras pakub aga laias valikus masinõppe funktsioone, mis sobivad ideaalselt nii struktureeritud andmete kui ka töötlemata meedia koolitamiseks. Teek hõlmab aga teksti- ja pildipõhiseid algoritme, et koolitada ja testida teie andmestikku.

instagram viewer

Kerase ainulaadne omadus on see, et see hoiab teid keskendunud raamatukogule, kuna see pakub ühes tükis kõike, mida vajate oma projekti jaoks. Nii et vaevalt peate hargnema, et teistest raamatukogudest kommunaalteenuseid laenata. Hüperparameetrite häälestamine, funktsioonide valik, rikkalikud andmete eeltöötluskihid ja andmete puhastamine on mõned selle suurepäraselt sisseehitatud funktsioonidest.

Keras võimaldab teil pilte ja tekste lugeda otse vanemkataloogi jagatud kaustadest ja hankida neist märgistatud andmestiku. Ja kui teie andmed on suured ega jää teie masina mällu, pakub Keras suure jõudlusega andmestiku objekti valikut. Sellele saate alati üle minna.

Seotud: Kuidas oma Pythoni ja AI oskusi täiendada Pythoni masinõppe raamatukogude abil

Lisaks pakub see mitmesuguseid graafilisi töötlusseadmeid (GPU) suure andmekogumi töötlemiseks. Seega võimaldab see samaaegselt käivitada CPU arvutusi koos GPU töötlemisega asünkroonselt.

2. TensorFlow

Google tutvustas seda 2015. aastal, TensorFlow on pigem raamistik kui raamatukogu. See on avatud lähtekoodiga teek, mis on ehitatud C ++ -ga ja töötab andmevoograafikute jälgimise teel.

TensorFlow on väga mitmekülgne ja ulatuslik, pakkudes palju muid sisseehitatud ühtseid raamatukogusid masinõppe arvutuste tegemiseks. Sisuliselt pakub TensorFlow skaleeritavat platvormi masinõppe kontseptsioonide, näiteks tehisnärvivõrkude (ANN), sügavate närvivõrkude ja süvaõppe loomiseks.

Seotud: Mis on TensorFlow Lite ja kuidas see on süvaõppe raamistik?

Tensorflow toetab lisaks Pythonile muu hulgas ka Java, C ++, Julia, Rust, Ruby ja JavaScripti. Kuigi TensorFlow kasutamine muude programmeerimiskeeltega peale Pythoni võib pakkuda lihtsat projektide integreerimist, on selle tuumade kasutamine Pythoni abil lihtsam, kuna see toetab täielikult TensorFlow rakendamist.

Lisaks võivad teistes keeltes arendatavad torud esitada API versioonide ühilduvusprobleeme, kui peate hiljem versioone vahetama. Kuigi TensorFlow'i dokumendid on kõikehõlmavad, võivad need erinevalt Kerast olla algajatele arusaamiseks liiga mitmekesised. Sellegipoolest on sellel kindel kogukonna tugi ja leiate ka palju avatud lähtekoodiga TensorFlow näited seal väljas.

TensorFlow eeliseks Kerase ees on see, et saate TensorFlowi kasutada otse ilma Keraseta. Loomulikult ei saa te Kerase kohta sama öelda, kuna see on TensorFlow enda hargnenud klass.

3. Mlib Säde

Siin on midagi päris käepärast Apache Sparkist. Avaldati ja tehti avatud lähtekoodiga 2010. Mlib Säde kasutab iteratiivseid arvutusi masinõppe algoritmide käitamiseks. Korduva iseloomu tõttu saab Mlib kasutada Hadoopi või kohalikke andmeallikaid ja töövooge. Lisaks on see võimeline lühikese aja jooksul käitama keerulist loogikat.

Lõppkokkuvõttes on see endiselt üks kiiremaid masinõppe raamatukogusid. See käitab laias valikus masinõppe algoritme, sealhulgas regressiooni-, klastrite-, klassifikatsiooni- ja soovitusmudeleid. See paistab silma ka andmete eeltöötluse ja mustrite kaevandamise osas.

Seotud: Mis on masinõppe algoritmid? Siin on, kuidas nad töötavad

Raamatukogu on dünaamiline ja pakub tugevat API -d, mis on ühendatud Scala, Pythoni, R ja Javaga. Mlib Spark on Sparki enda varustus, seega uuendatakse seda iga Sparki väljalaskega.

Mlib Sparkil on selgitav dokumentatsioon, nii et algaja saab selle hõlpsalt kätte. Kuid väike puudus on see, et see integreerub vaid mõne programmeerimiskeelega, nii et see võib olla probleem, kui te ei tunne praegu toetatavaid keeli.

4. mlpakend

mlpakend ilmus 2008. aastal ja töötati välja koos C ++ -ga, kasutades lineaarse algebra raamatukogu nimega Armadillo. Nagu Mlib Spark, võimaldab see rakendada enamikku saadaolevatest masinõppe algoritmidest ja kontseptsioonidest otse oma andmekogumile, kasutades lühikesi ja loetavaid koodiridu.

Lisaks sellele, et see on saadaval programmeerimiskeeltes nagu Python, C ++, Go ja Julia, toetab see ka CLI täitmist, mis võimaldab teil käivitada oma koodi ja saada koheseid vastuseid. Ehkki see toetab nende teiste keeltega sidumist, ei pruugi mlpacki käivitamine suurtes andmekogumites, mis nõuavad keerulist arvutamist, hea mõte, kui kasutate seda mõne teise programmeerimiskeelega. Seega on mlpacki puhul sageli probleemiks mastaapsus teiste keeltega peale C ++.

Kui olete masinõppe algaja ja tunnete C ++, saate seda siiski proovida. Dokumentatsioonis on hõlpsasti järgitavad juhendid ja näited, mis on saadaval erinevate programmeerimiskeelte jaoks. Kuna mlpack kasutab C ++ kontseptsioonide arvutusi, kasutab see madala taseme koodi keeruliste ja lihtsate masinõppe ülesannete kiireks täitmiseks.

5. Pytorch

Arenes Facebook Pytorch ja avaldas selle ametlikult 2016. Pytorch on tuntud oma laialdase arvutinägemise, sügava õppimise ja loomuliku keele töötlemise poolest. See on avatud lähtekoodiga raamatukogu, mis on ehitatud Torchi raamistikust.

Nagu Keras ja Tensorflow, toetab ka Pytorch andmekogumite protsessorit. Ja kui teie andmekogum on suur, sisaldab see teie arvutuste tegemiseks GPU -protsessorit. Lisaks on see tensoripõhine.

Lisaks Pythonile toetab raamatukogu sidumist nii C ++ kui ka Java jaoks. Pytorch pakub lisaks muudele utiliitidele ka täiendavaid raamatukogusid, sealhulgas tõrvikuvisioon, tõrvikutekst, torchaudioja TorchServe.

Need raamatukogud on osa Pytorchi masinõppe funktsioonidest ja nendega kohtate oma Pytorchi mudeleid kirjutades. Üksikasjaliku ja põhjaliku juhendajapõhise dokumentatsiooni abil on Pytorchi lihtne mõista, kui olete masinõppe kontseptsioonidega tuttav.

Pytorch võimaldab teil ka muuta andmekogumid masinasõbralikuks vorminguks. Seega on see ka täiuslik raamatukogu andmete eeltöötlemiseks. Pytorchi abil on alati võimalik funktsioonide eraldamine, andmete puhastamine, andmete jagamine ja hüperparameetrite häälestamine.

6. Scikit-Learn

Ümbritsevalt ehitatud Pythoni abil, skikit-õppida, nimetatud ka õppima, avaldati avalikult 2010. Raamatukogu teenindab aga laias valikus masinõpperakendusi, sealhulgas esiletõstetud ja esiletõstetud andmekogumite modelleerimist.

Scikit-learning pakub tuttavaid jälgitavaid algoritme, sealhulgas lineaarseid ja logistilisi regressioonimudeleid, toetusvektorite masin (SVM), Naive Bayes, otsustuspuud, lähimad naabrid, muu hulgas otse kasti. See on ka rikkalik allikas järelevalveta õppemeetoditele, nagu rühmitamine, Gaussi mudel koos närvivõrgu mudelitega ja palju muud.

Sisuliselt toetab scikit-learning nii jälgitavaid kui ka järelevalveta mudeleid. See on suurepärane lähtepunkt, kui olete Pythonis või masinõppes üldiselt alles uus, sest see on täielikult Pythonil põhinev. Ja kui alles alustate masinõppe või andmeteadusega, võiksite alustada skikit-õppimise juhendatud õppimisfunktsioonidega.

Üldiselt on see algajatele sõbralikum kui teised loendis olevad raamatukogud. Erinevalt teistest varem mainitud raamatukogudest sõltub scikit-learning suure jõudlusega matemaatiliste arvutuste tegemisel tohutult Numpyst ja Scipyst. Samuti kasutab see Matplotlibi veenvate jutustavate visualiseerimiste esitamiseks.

7. Theano

Kui otsite raamatukogu, mis aitab keerulisi probleeme paindlikeks algoritmideks jagada, siis Theano võib olla see, mida sa tahad. 2007. aastal Yoshua Bengio poolt Kanadas Montrealis loodud Theano on võimas raamatukogu väikeste ja suure jõudlusega arvutuste tegemiseks.

Nagu Scikit-Learn, sõltub ka Theano numbriliste arvutuste tegemisel Numpyst. Raamatukogu toetab GPU-põhiseid arvutusi, lisaks genereerib see madala taseme C-koodi. See kiirendab Theanoga matemaatilisi hindamisi, olenemata nende suurusest. Lisaks töötavad selle süvaõppemudelid tenoritel.

Theano abil saate oma andmekogumi teisendada loetavateks ujuk-, kahend- või täisarvupunktideks, olenemata selle esialgsest andmetüübist. Siiski ei pruugi te saada piisavalt kogukonna tuge. Seda seetõttu, et Theano pole nii populaarne kui teised varem mainitud raamatukogud. See ei muuda seda vähem algajasõbralikuks.

Dokumentides sisalduvat õpetust on lihtne mõista. Selle võime lihtsustada keerukaid massiive ja optimeerida lõpmatuid arvutusi muudab selle ideaalseks skaleeritavate masinõppemudelite loomiseks.

Millist raamatukogu peaksite oma järgmise masinõppeprojekti jaoks kasutama?

Kuigi oleme maininud mõnda kõige laialdasemalt kasutatavat masinõppe teeki, pakume välja parim võib olla karm, kuna neil kõigil on väga sarnased eesmärgid, kuid neil on vaid mõned erinevused Funktsioonid.

Muidugi, kui alustate mõnele algajasõbralikumale raamatukogule, nagu Scikit-Learn või Keras, on abi, kui hakkate lihtsalt valdkonda sisenema. Peale selle aitab projekti jaoks raamatukogu sihipärane valimine kitsendada teie arendusprojekti keerukust. Kuid sellest hoolimata on kursuste ja õpetuste kaudu masinõppe põhialustega tutvumine kasulik.

JagaPiiksumaE -post
Mis on masinõppe algoritmid? Siin on, kuidas nad töötavad

Masinõppe algoritmid on loodud elu lihtsustamiseks ja süsteemide täiustamiseks, kuid need võivad halba tagajärgedega viltu minna.

Loe edasi

Seotud teemad
  • Programmeerimine
  • Masinõpe
  • Programmeerimine
Autori kohta
Idowu Omisola (Avaldatud 91 artiklit)

Idowu on kirglik kõige nutika tehnoloogia ja tootlikkuse vastu. Vabal ajal mängib ta kodeerimisega ja lülitab malelauale, kui tal on igav, kuid talle meeldib ka aeg -ajalt rutiinist lahti saada. Tema kirg näidata inimestele teed kaasaegses tehnoloogias motiveerib teda rohkem kirjutama.

Veel Idowu Omisolast

Telli meie uudiskiri

Liituge meie uudiskirjaga, et saada tehnilisi näpunäiteid, ülevaateid, tasuta e -raamatuid ja eksklusiivseid pakkumisi!

Tellimiseks klõpsake siin