Mnoho moderních uživatelůpočítačové systémy, nebo spíše designéři, tak či onak čelí problému, když je nutné rozpoznat písmo textu, které je obsaženo v nějakém obrázku. Nyní zvážíme několik nejjednodušších možností, jak to udělat s minimální investicí času a úsilí.
Rozpoznávání písma: základní aspekty
Začněme tím, že je to obecně naivnímyslet si, že detekce písma je stejná jako rozpoznávání textu. Rozpoznání textu vytvořeného v editoru nebo jednoduše napsaného na starých psacích strojích je jen speciální případ obecnější definice. A ani takové výkonné programy, jako je ABBYY Fine Reader, k tomu nejsou vždy vhodné. Samozřejmě vědí, jak extrahovat fragmenty textu z požadovaného obrázku, ale ve většině případů se analýza provádí pouze na základě standardních písem, která jsou univerzální pro všechny typy textových editorů a jsou volně integrována do aplikací tohoto typu, což umožňuje jejich použití i nezávisle na hlavní softwarové platformě.
Ale co dělat, když je vyžadováno uznánípísmo, které je ručně vytvořeno například v grafické aplikaci nebo je obecně ručně kreslené? Posuďte sami, protože umělec si může líčit jakýkoli dopis podle libosti.
Nejjednodušší příklad jealespoň původní sbírky ruských lidových pohádek, kde každé velké písmeno na začátku prvního odstavce textu bylo zdobeno vzorovaným vzorem. Ze všech těchto zahlcení musí počítačový program vybrat písmeno a zahodit vše ostatní. To je důvod, proč je rozpoznávání cyrilských písem, i ve srovnání s hieroglyfy, poměrně obtížný úkol. K tomu však existují určité prostředky.
Aplikace pro rozpoznávání písem na obrázku
Nyní se podívejme na několik jednoduchých softwarových produktů, které jsou vhodné pro uživatele jakékoli úrovně.
Za prvé stojí za zmínku aplikace CuneiForm.Toto je program pro rozpoznávání písem, včetně azbuky, který vám umožňuje nejen určit, do kterého jazyka text patří, a to i při neobvyklém písmu, ale také zachovat původní strukturu celého dokumentu. Například pokud byl vytvořen v nějaké počítačové aplikaci, obsahuje tabulková data (stejně jako samotnou tabulku), může aplikace snadno definovat takovou strukturu a uložit ji při zobrazení výsledků. Totéž platí pro formátování použité v dokumentu.
Jednou z hlavních funkcí aplikace jea skutečnost, že kromě podpory několika jazyků má program vlastní slovník, který se používá při analýze textu prováděné na konci procesu rozpoznávání písma. Program zároveň dobře funguje s dokumenty nízké kvality, například se skenovanými starými fotografiemi s textem nebo historickými dokumenty. Do základny slovníku lze mimo jiné přidat nová data pro další použití.
Lze volat velmi jednoduchou aplikaciProgram Font Analyze. Aniž bychom se ponořili do principů jeho fungování, všimneme si pouze samotného procesu. Zde uživatel potřebuje pouze načíst obrázek s písmem do pole analyzátoru a poté aktivovat proces rozpoznávání. „Trik“ je v tom, že po obdržení výsledku skenování a zpracování jej lze upravit.
Zajímavý je také systém Font Matching Tool.Doporučuje se mimo jiné používat tuto aplikaci ve spojení s programem Porovnat !, který umožňuje porovnat původní dokument a výsledek s rozpoznanými písmy.
Online služba pro rozpoznávání písma
Kromě programů nainstalovaných v počítači, nebojejich přenosné verze, můžete využít služeb mnoha internetových zdrojů. Rozpoznávání písma na obrázku v akčním plánu se provádí obdobně jako v předchozích aplikacích. Jediný rozdíl je v tom, že uživatel nahraje obrázek přímo na web a výsledek se stáhne do jeho počítače.
Mezi nejoblíbenější a nejžádanějšíslužby zahrnují online systémy jako What The Font, Identifont, Message Boards: Typophile, Bowfin Printworks, Type Navigator, Flickr Typeface Identification a mnoho dalších.
Závěr
Zbývá přidat pouze to, co není nijak zvlášťje lepší nespoléhat se na programy nebo internetové zdroje. Není důvod očekávat od nich něco nadpřirozeného. Posuďte sami, protože ne všichni internetoví roboti rozpoznávají ani obyčejnou captchu. Zde je však zřejmá analogie s programy určenými pro rozpoznávání písem. Při použití těchto nástrojů se tedy můžete spolehnout hlavně na výsledky určení nejjednodušších písem. Další věc je, že jsou rozpoznávány nikoli z tištěných kancelářských dokumentů, ale z obrázků. To je ve skutečnosti hlavní výhoda všech softwarových produktů a služeb tohoto typu.