reklama
Pokud chcete převést jakýkoli tištěný text na digitální text, který můžete kopírovat, vkládat, upravovat a prohledávat, budete muset použít skenery Optical Character Recognition (OCR).
Pokud se rozhodnete skenovat nebo pořídit fotografii dokumentu, uloží se ve formátu, jako je JPEG nebo PDF. Software OCR pak mohou rozeznat písmena a čísla v těchto dokumentech a převést je na a prohledávatelné PDF 4 způsoby vytváření a úpravy souborů PDF zdarmaZe všech běžných typů souborů, které se vyskytují v našem výpočetním světě, je PDF pravděpodobně jedním z nejvíce restriktivních, přičemž je zároveň k dispozici všem (především ke čtení) ... Přečtěte si více , nebo do souboru, který můžete upravovat v programech, jako je Microsoft Word.
Problém je v tom, že některé OCR skenery fungují mnohem lépe než jiné, s tím nejlepším, že jsou na peněžence docela těžké.
Například Omnipage18 stojí 150 USD, ale je obzvláště dobrý v rozpoznávání různých jazyků. Adobe Acrobat Pro DC stojí oko-zalévání 400 dolarů, ale má neuvěřitelnou přesnost.
ABBYY FineReader stojí 150 USD, ale je fantastický při převodu dokumentů, jako jsou časopisy a brožury, na text, který lze prohledávat. Později v tomto článku budeme testovat online nabídku společnosti ABBYY.Nicméně, pokud jste po volných alternativ, které můžete stažení a používat ve Windows nebo OS X, měli byste vyzkoušejte tyto nástroje OCR 5 nejlepších OCR nástrojů pro extrahování textu z obrázkůKdyž máte hromádku papíru, jak lze veškerý tištěný text převést na něco, co digitální program dokáže rozpoznat a indexovat? Udržujte dobrý software OCR v blízkosti. Přečtěte si více . Ale pokud byste raději použili zdarma, online Nástroj OCR, pokračujte ve čtení, protože jsme vyzkoušeli několik nejlepších, s níže uvedenými výsledky.
Zkouška
Zdá se, že většina lidí nyní používá své chytré telefony, aby je prohledaly Skenujte a spravujte své příjmy, šetřete místo, papír a časPapírové účtenky se snadno ztratí a je těžké je najít, když je potřebujete nejvíce. Naštěstí, přechod na digitální řeší oba tyto problémy. Přečtěte si více , Rozhodl jsem se použít Aplikace Evernote's Scannable (Zdarma na iOS a Android). Naskenoval jsem první stránku Richarda Dawkina Horolezectví je nepravděpodobné, abychom viděli, jaké výsledky bychom mohli dosáhnout při velmi jednoduchém formátování. Také jsem naskenoval stránku Tim Ferriss 4-hodinový šéfkuchař vyzkoušet skenery s trochu komplikovanějším formátováním. Uložil jsem každý z těchto souborů jako PDF.
Tyto dokumenty pak procházely některými z údajně nejlepších online nástrojů OCR, aby zjistily, jak se jim daří.
Zdarma online OCR [již není k dispozici]
Naštěstí není nutné používat bezplatnou online OCR. A byl jsem dvakrát ohromen, když jsem viděl jejich požadavek zachovat formátování a rozvržení mého dokumentu.
Web prohlašuje, že je schopen podporovat PDF, GIF, BMP, JPEG, TIFF a PNG jako vstup. Výstupy mohou být buď DOC, textový dokument PDF, RTF a TXT. Bohužel jsem nemohl zjistit, jestli mají limit velikosti souboru.
Základní dokument do formátu PDF
Převedeno naprosto dokonale. Není toho víc co říct! Jdeme na a velmi dobrý začátek.
Základní dokument k DOC
Zdá se, že skutečná slova se bezchybně přeměnila, kromě „tupé“ z „Mount Rushmore“ nějakým způsobem AWOL. Formátování je ale jiný příběh. Mnoho čárek bylo nahrazeno podtržítky a do bodů v celém dokumentu byly vloženy náhodné mezery. Když ale později uvidíte, jak se prémiovému softwaru v tomto testu darilo, nejedná se o špatné úsilí vůbec.
Složitý dokument do formátu PDF
Převedení dokumentu trvalo neuvěřitelných 120 sekund! Po dokončení byl veškerý text převeden s přibližně 95% přesností, i když text v samostatném poli v pravém horním rohu stránky byl nedostupný. Také několik dalších znaků v PDF bylo nesprávných.
Složitý dokument k DOC
Tentokrát konverze trvala pouze 10 sekund a text byl znovu převeden s přesností okolo 95%. Došlo k nějakým zvláštním problémům s mezerami a software měl potíže s převedením písma v pravém horním rohu dokumentu a vynechal několik znaků sem a tam.
Výrok
Pokud chcete převést jednoduše formátované dokumenty do formátu PDF, je to skvělý nástroj. Pokud jde o převod na DOC, výsledky neměly o čem psát.
i2OCR uvádí několik působivých požadavků. Nástroj rozpoznává více než 60 jazyků, zvládne rozložení ve více sloupcích (odstraněním formátování), nemá omezení velikosti souborů, převádí nahrané soubory a z adres URL. Pro použití tohoto nástroje se nemusíte registrovat.
Služba funguje jednoduše extrahováním textu z vašeho obrázku a výstupem neformátovaného textu. Jakékoli chyby v zobrazení vedle sebe můžete rychle opravit před kopírováním textu do jiných programů nebo před stažením ve formátu DOC, PDF nebo HTML.
Poznámka: Když jsem se pokusil nahrát své dokumenty PDF, byly i2OCR odmítnuty, takže jsem je musel převést do formátu JPEG (vytvořením snímku obrazovky a poté nahráním souborů).
Základní dokument pro prostý text
Vzhledem k tomu, jak tento nástroj funguje, je veškeré formátování ztraceno, i když převod z obrázku na text byl téměř dokonalý. Vyskytly se některé malé chyby, například mezery mezi odstavci, a některé čárky byly nahrazeny tečkami, ale jedná se o malé kousky.
Složitý dokument pro prostý text
Většina textu byla převedena bez příliš mnoha chyb, kromě názvu a receptu vpravo nahoře, což bylo pro tento nástroj nečitelné. Způsob, jakým byly sloupce převedeny na prostý text, nebyl zdaleka ideální. Pokud chcete, aby tato konverze byla funkční, bylo by potřeba hodně času, aby se řádky uspořádaly do souvislých vět.
Výrok
Pro základní dokumenty funguje i2OCR skvěle. Schopnost upravit text před stažením je také velmi pěkný dotek. U složitějších dokumentů je však převod stále velmi přesný, ale způsob, jakým je text odesílán, vám život nijak výrazně zjednoduší.
Online OCR v současné době podporuje 46 různých jazyků a dokáže převádět PDF, JPG, BMP, TIFF a GIF do formátu Word, Excel nebo prostý text. Web tvrdí, že „převedené dokumenty vypadají přesně jako původní - tabulky, sloupce a grafika“.
Verze, kterou můžete použít bez registrace, umožňuje převést až 15 obrázků za hodinu (limit 5mb). Pokud se zaregistrujete k účtu, můžete si v horní části tohoto limitu zakoupit další stránky a také převést vícestránkové dokumenty a ZIP archivy.
Základní dokument k DOC
Základní dokument bezchybně převeden na římskou číslici Já není vyzvednut. Jak web slíbil, formátování bylo přesně takové, jaké byly v knize. Kudos k tomuto nástroji.
Složitý dokument k DOC
Poté, co mě zklamaly předchozí nástroje OCR při převádění komplexního dokumentu, byl jsem online OCR masivně ohromen. Rozložení bylo téměř dokonalé, jak můžete vidět výše. Ještě jednou však recept nebyl vyzvednut příliš dobře, ale jakékoli jiné drobné chyby byly zanedbatelné.
Výrok
Absolutně fantastické výsledky z online OCR. Jediná nevýhoda, kterou vidím, je, že neexistuje způsob, jak stáhnout převedené dokumenty ve formátu PDF, protože uvedené výstupní formáty zahrnují pouze DOCX, XLSX a TXT.
Jak již bylo zmíněno dříve, ABBYY je jedním z lídrů na trhu v oblasti softwaru OCR a stojí asi 150 USD za celý svůj program ke stažení. Nabízejí a 10stránková bezplatná zkušební verze pro jejich online nástroj, i když (nutná registrace). V případě předplatného 5 $ vám jejich online nástroj umožní každý měsíc převést 200 stránek.
Soubory mohou být až 100 MB v kterémkoli z těchto formátů: PDF, JPG, JPEG, TIF, TIFF, PCX, DCX, BMP a PNG. ABBYY také rozpoznává téměř 200 jazyků. Výstupy jsou obzvláště působivé, s výběrem mezi DOCX, XLSX, RTF, TXT, PPTX, ODT, PDF, FB2 a EPUB.
Během zkoušky můžete dokonce vyzkoušet několik funkcí BETA. První je možnost překládat dokument do jiného jazyka. Druhým je export převedeného dokumentu do účtu cloudového úložiště, ať už jde o Dropbox, Disk Google, Evernote, Microsoft OneDrive nebo Box.
Základní dokument DOCX
Celkové výsledky byly dobré, ale ne úžasné vzhledem k tomu, že se jedná o prémiový produkt. Bylo vyměněno několik čárek a období, několik převrácených čárek bylo nahrazeno hvězdičkou, chybělo několik velkých písmen a jedno slovo (literalista) bylo napsáno nesprávně.
Složitý dokument pro DOCX
Po převodu bylo v dokumentu v dokumentu jen velmi málo chyb (kromě OCR, který se opět potýká s písmo tohoto receptu!), Ale formátování nechalo mnoho žádostí.
Tyto tři sloupce nějak zabíraly dvě stránky, s centrálním sloupcem pouze na druhé stránce. Pokud jste chtěli vlastně dělat cokoli s tímto převedeným dokumentem, byste nakonec vytáhl vlasy ven.
Základní dokument do formátu PDF
Při kontrole převedeného PDF jsem nenašel žádnou chybu. Možná jsme zjistili, kde ABBYY vyniká. Fantastické výsledky.
Složitý dokument do formátu PDF
Opět jsem v tomto převedeném souboru nenašel žádné chyby. ABBYY samozřejmě umí převést do PDF výjimečně dobře.
Výrok
Pokud jste rádi zaplatili pár dolarů, zdá se, že převod na PDF s touto službou a bytí funguje fenomenálně dobře možnost synchronizovat převedené soubory do cloudového úložiště je zvláště užitečné, pokud skenujete velký objem dokumenty. Stejně jako u jiných možností však ABBYY stále nepřišel na to, jak bezchybně převést dokumenty na DOC pro snadnou editaci.
Konečný výsledek
Pokud, stejně jako většina lidí, právě chcete skenovat několik článků z časopisů a některé účty za domácnost, nebudete muset tyto dokumenty upravovat. Proto je pro vás vhodný převod přímo do formátu PDF, protože tyto dokumenty budete stále moci prohledávat. Z tohoto důvodu byl OCR online zdarma rozhodně nejlepším bezplatným nástrojem, který jsme testovali. Jak již bylo řečeno, pokud jste ochotni zaplatit 5 $ měsíčně za téměř dokonalost, FineReader online od ABBYY byla o něco přesnější.
Pokud jde o převod dokumentů na DOC, nepodařilo se nám najít žádné dokonalé řešení, ale zdaleka nejlepší výsledky přišly od Online OCR. Převod nebyl dokonalý, ale integrita formátování byla do značné míry zachována a chyby byly zanedbatelné. Porovnáme-li tyto výsledky s „prémiovou“ nabídkou od společnosti ABBYY, nemůžete pomoci, ale můžete být ohromeni.
Nezahrnuli jsme Schopnosti OCR na Disku Google v tomto příspěvku; trochu pro všudypřítomnost Google, ale spíše pro to, že jsme chtěli vyzkoušet několik dalších online služeb OCR online zdarma.
Před vámi: Jaké další online nástroje OCR byste našim čtenářům doporučili? A které jste vyzkoušeli, že už nikdy nebudete používat?
Rob Nightingale vystudoval filozofii na University of York ve Velké Británii. Více než pět let pracoval jako manažer sociálních médií a konzultant, zatímco pořádal workshopy v několika zemích. Za poslední dva roky byl Rob také autorem technologie a je MakeUseOf's Social Media Manager a Newsletter Editor. Obvykle ho najdete na cestách...