Reklaam

Kui soovite teisendada prinditud teksti digitaalseks tekstiks, mida saate kopeerida, kleepida, redigeerida ja otsida, peate kasutama optilise märgituvastuse (OCR) skannerit.

Kui valite dokumendi skannimise või foto tegemise, salvestatakse see sellises vormingus nagu JPEG või PDF. OCR-tarkvara saab need tähed ja numbrid nendes dokumentides ära tunda ja teisendada a-ks otsitav PDF 4 tasuta failide loomise ja redigeerimise meetoditKõigist levinumatest failitüüpidest, mida meie arvutimaailmas leitakse, on PDF ilmselt üks kõige piiravamaid, samal ajal kui see on kõigile kasutamiseks (peamiselt lugemiseks) kättesaadav ... Loe rohkem või faili, mida saate redigeerida sellistes programmides nagu Microsoft Word.

Probleem on selles, et mõned OCR-skannerid töötavad palju paremini kui teised, kõige parem on see, et rahakott on üsna raske.

Näiteks Omnipage18 maksab 150 dollarit, kuid on eriti hea erinevate keelte äratundmiseks. Adobe Acrobat Pro DC maksab pilkupüüdev 400 dollarit, kuid on uskumatu täpsusega.

ABBYY FineReader maksab 150 dollarit, kuid on fantastiline dokumentide, näiteks ajakirjade ja brošüüride teisendamisel otsitavaks tekstiks. Testime selles artiklis hiljem ABBYY veebipõhist pakkumist.

Kui aga olete pärast tasuta alternatiive, saate seda teha lae alla ja Windowsis või OS X-is kasutamiseks peaksite seda tegema proovige neid OCR-tööriistu 5 parimat OCR-i tööriista piltide teksti eraldamiseksKui teil on paberirullid, kuidas teisendada kogu trükitud tekst millekski, mida digitaalprogramm suudab ära tunda ja indekseerida? Hoidke hea OCR-tarkvara läheduses. Loe rohkem . Kuid kui eelistaksite tasuta, veebis OCR-tööriist, lugege edasi, nagu me paar peamist proovinud oleme, ja tulemused on allpool.

Test

Paistab, et enamik inimesi kasutab nüüd oma nutitelefonid, et neid skannida Skaneerige ja hallake oma laekumisi, säästke ruumi, paberit ja aegaPaberkviitungid on hõlpsasti kadunud ja neid on raske leida, kui neid kõige rohkem vajate. Õnneks lahendab digitaalne lähenemine mõlemad need probleemid. Loe rohkem , Otsustasin kasutada Evernote skannitav rakendus (Tasuta iOS-is ja Android-is). Skaneerisin Richard Dawkini esimese lehe Ronimismägi on ebatõenäoline, et näha, milliseid tulemusi saaksime väga lihtsa vormindamise korral. Skaneerisin ka Tim Ferrissi lehe 4-tunnine kokk skannerite proovimiseks veidi keerukama vorminguga. Salvestasin kõik need failid PDF-failina.

OCR-ide testimine veebis

Seejärel juhiti neid dokumente läbi mõne väidetavalt parima veebis asuva OCR-i tööriista, et näha, kui hästi need käitusid.

Tasuta online OCR [pole enam saadaval]

Õnneks pole tasuta online-tekstituvastuse kasutamiseks vaja registreerimist. Ja mul oli kahekordne mulje, kui nägin nende nõuet säilitada oma dokumendi vormindamine ja paigutus.

Tasuta online OCR

Sait väidab, et suudab sisendina toetada PDF, GIF, BMP, JPEG, TIFF ja PNG. Väljunditeks võivad olla DOC, PDF-tekstdokumendid, RTF ja TXT. Kahjuks ei saanud ma teada, kas neil oli faili suuruse piirang.

Põhidokument PDF-i
Teisendatud täiesti suurepäraselt. Pole palju muud öelda! Me oleme väljas väga hea algus.

Põhidokument DOC-le
Tundub, et tegelikud sõnad on veatult teisenenud, välja arvatud „Rushmore'i mäe” ount, mis läheb kuidagi AWOL-i. Vorming on siiski teine ​​lugu. Paljud komad asendati allakriipsudega ja kogu dokumendi punktidesse lisati juhuslikke tühikuid. Kui näete hiljem, kuidas premium-tarkvara selles testis edasi läks, pole see sugugi halb ettevõtmine üleüldse.

Keeruline dokument PDF-i
Dokumendi teisendamine võttis ilmatu 120 sekundit! Kui see on valmis, oli kogu tekst teisendatud umbes 95% täpsusega, kuigi lehe paremas ülanurgas asuvas eraldi kastis olev tekst oli otsimata. Ka mõned teised PDF-i tähemärgid olid valed.

Kompleksdokument DOC-le
Seekord võttis teisendamine ainult 10 sekundit ja tekst teisendati uuesti umbes 95% täpsusega. Tekkisid veidrad vaheprobleemid ja tarkvaral oli raskusi dokumendi paremas ülanurgas oleva fondi teisendamisega ja ta jättis paar tähemärki siit ja sealt välja.

Kohtuotsus
Kui soovite teisendada lihtsalt vormindatud dokumente PDF-ideks, on see suurepärane vahend. DOC-le teisendamisel ei olnud tulemustel kodus midagi kirjutada.

i2OCR esitab mõned muljetavaldavad väited. Tööriist tuvastab üle 60 keele, saab hakkama mitmeveeruliste paigutustega (vormingu eemaldamisega), tal pole failisuuruse piiranguid, saab üleslaaditud faile teisendada ja URL-idelt. Ja selle tööriista kasutamiseks ei pea te registreeruma.

Teenus toimib lihtsalt selle, et eraldate oma pildilt teksti ja väljastate seejärel vormindamata teksti. Enne teksti teistesse programmidesse kopeerimist või DOC-, PDF- või HTML-vormingus allalaadimist saate kõrvaldada kõik vead külgvaates.

Märkus. Kui proovisin oma PDF-dokumente üles laadida, lükkas i2OCR need tagasi ja seetõttu pidin need teisendama JPEG-vormingusse (tehes neist ekraanipildi ja laadides seejärel failid üles).

Põhidokument lihttekstinaEkraanipilt 2016-02-11 kell 12.30.28
Selle tööriista tööpõhimõtte tõttu kaob kogu vormindamine, ehkki teisendamine pildilt tekstile oli peaaegu täiuslik. Esines väikseid vigu, näiteks lõikude vahe, ja mõned komad asendati punktidega, kuid need on väikesed nigud.

Lihtne tekst lihttekstinaEkraanipilt 2016-02-11 kell 12.39.48
Suurem osa tekstist muudeti ilma liiga paljude vigadeta, välja arvatud pealkiri ja retsept ülaosas paremal, mis oli selle tööriista jaoks loetamatu. See, kuidas veerud lihttekstideks muudeti, polnud kaugeltki ideaalsed. Kui soovite selle teisendamise teostatavaks muuta, kulub ridade järjepidevateks lauseteks ümberkorraldamiseks palju aega.

Kohtuotsus
Põhidokumentide puhul töötab i2OCR suurepäraselt. Võimalus teksti enne allalaadimist redigeerida on ka väga tore puudutus. Keerukamate dokumentide puhul on konverteerimine siiski üsna täpne, kuid teksti väljastamise viis ei muuda teie elu palju lihtsamaks.

Online OCR toetab praegu 46 erinevat keelt ning saab teisendada PDF-, JPG-, BMP-, TIFF- ja GIF-vormingus Wordi, Exceli või lihtteksti. Sait väidab, et "konverteeritud dokumendid näevad välja täpselt nagu originaal - tabelid, veerud ja graafika".

Ilma registreerimiseta kasutatav versioon võimaldab teil teisendada kuni 15 pilti tunnis (5mb limiit). Kui registreerute kontole, saate selle limiidi piires osta rohkem lehti, saades samal ajal teisendada ka mitmelehelisi dokumente ja ZIP-arhiive.

OCR-i veebitulemid

Põhidokument DOC-le
Alusdokument muudeti veatult peale Rooma numbri Mina ei võeta kätte. Nagu sait lubas, oli vorming täpselt selline, nagu raamatus oli. Kudos selle tööriista juurde.

Kompleksdokument DOC-le
Pärast pettumust varasemates OCR-i vahendites keeruka dokumendi teisendamisel, avaldas mulle Online OCR tohutut muljet. Nagu ülal näete, oli paigutus peaaegu täiuslik. Kuid jällegi ei valitud retsepti liiga hästi, kuid kõik muud väiksemad vead olid tähtsusetud.

Kohtuotsus

Online OCR-i täiesti fantastilised tulemused. Ainus negatiivne külg, mida ma näen, on see, et teisendatud dokumente ei saa alla laadida PDF-failidena, kuna mainitud väljundvormingud hõlmavad ainult DOCX, XLSX ja TXT.

Nagu varem mainitud, on ABBYY üks OCR-tarkvara turuliidreid, kelle täielik allalaaditav programm maksab umbes 150 dollarit. Nad pakuvad a 10-leheküljeline tasuta prooviversioon siiski nende veebitööriista jaoks (vajalik registreerimine). 5-dollarise tellimuse korral võimaldab nende veebitööriist teisendada iga kuu 200 lehte.

ABBYY FineReader Online

Vastuvõetavate failide suurus võib olla kuni 100 MB, mis tahes järgmistes vormingutes: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP ja PNG. ABBYY tunneb ära ka peaaegu 200 keelt. Väljundid on eriti muljetavaldavad, valides on DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 ja EPUB.

Saate proovimise ajal proovida isegi paari BETA funktsiooni. Esimene on võimalus tõlkida oma dokument teise keelde. Teine võimalus on konverteeritud dokumendi eksportimine pilve salvestuskontole, olgu selleks Dropbox, Google Drive, Evernote, Microsoft OneDrive või Box.

Põhidokument DOCX-i
Üldised tulemused olid head, kuid pole hämmastavad, arvestades, et see on esmaklassiline toode. Vahetati mitu koma ja perioodi, mitu ümberpööratud koma asendati tärnidega, paar suurt suurt tähte ei olnud ja üks sõna (literaal) kirjutati valesti.

Kompleksdokument DOCX-i
Pärast teisendamist oli dokumendis tekstis väga vähe vigu (peale OCR-i, kes võitleb uuesti selle retsepti šriftiga!), Kuid vormindamine jättis soovida.

ABBYY tulemus

Kolm veergu moodustasid millegipärast kaks lehekülge koos keskse veeruga ainult ilmub teisel lehel. Kui sa tegelikult tahaksid teha mis iganes selle konverteeritud dokumendiga on, siis tõmbate oma juuksed lõpuks välja.

Põhidokument PDF-i
Teisendatud PDF-i üle vaadates ei leidnud ma ühtegi viga. Võib-olla oleme leidnud, kus ABBYY silma paistab. Fantastilised tulemused.

Keeruline dokument PDF-i
Jällegi ei leidnud ma sellest konverteeritud failist ühtegi viga. ABBYY teab ilmselgelt, kuidas PDF-vormingusse teisendada.

Kohtuotsus
Kui maksate mõne dollari üle hea meelega, näib PDF-i teisendamine selle teenuse ja fenomenaalselt fenomenaalselt hästi toimivat konverteeritud failide sünkroonimine pilvesalvestusse on eriti kasulik, kui skannite suurt mahtu dokumendid. Nagu teistegi võimaluste puhul, pole ABBYY ikka veel välja mõelnud, kuidas dokumentide hõlpsaks redigeerimiseks DOC-ks teisendada.

Lõpptulemus

Kui soovite, nagu enamik inimesi, skannida vaid mõnda ajakirjaartiklit ja mõnda majapidamisarvet, ei pea te neid dokumente redigeerima. Seetõttu sobib otse PDF-faili teisendamine teile, kuna saate endiselt nendes dokumentides otsida. Selle jaoks oli Free Online OCR kindlasti parim tasuta tööriist, mida testisime. Seda öeldes, kui olete nõus maksma 5 dollarit kuus peaaegu täiuslikkuse eest, ABBYY FineReader Online oli pisut täpsem.

Dokumentide DOC-deks teisendamisel ei õnnestunud meil leida ideaalset lahendust, kuid kaugelt olid parimad tulemused Online OCR. Konversioon ei olnud täiuslik, kuid vormindamise terviklikkus hoiti enamasti puutumata ja vead olid tühised. Võrreldes neid tulemusi ABBYY premium-pakkumisega, ei saa te aidata, kuid tohutult muljet avaldada.

Me ei lisanud Google Drive'i OCR-i võimalused selles postituses; natuke Google'i igakülgsest teadlikkusest, aga veelgi enam asjaolust, et tahtsime seal proovida veel mõnda muud tasuta veebis OCR-teenust.

Teile üle: milliseid muid Interneti-põhiseid OCR-tööriistu soovitaksite meie lugejatele? Ja mida olete proovinud, et te ei kasutaks enam kunagi?

Rob Nightingale on omandanud filosoofia kraadi Suurbritannia Yorki ülikoolis. Ta on töötanud üle viie aasta sotsiaalmeedia juhi ja konsultandina, pakkudes samas seminare mitmes riigis. Viimased kaks aastat on Rob töötanud ka tehnoloogiakirjutajana ning on MakeUseOfi sotsiaalmeedia haldur ja uudiskirja toimetaja. Tavaliselt leiad teda reisimas…