Әдетте, сканерленген мәтінді тануға арналған бағдарламалар туралы (OCR, таңбаларды оптикалық тану) пайдаланушылардың көпшілігі жалғыз өнімді еске түсіреді - ABBYY FineReader, ол, сөзсіз, Ресейдегі осындай бағдарламалық жасақтама арасында көшбасшы және әлемдегі көшбасшылардың бірі болып табылады.
Алайда, FineReader - бұл жалғыз шешім емес: мәтінді тануға арналған ақысыз бағдарламалар бар, сол мақсатта ғаламтор қызметтері, сонымен қатар мұндай функциялар компьютерде орнатылған болуы мүмкін кейбір бағдарламаларда бар. . Мен мұның бәрі туралы осы мақалада жазуға тырысамын. Барлық қарастырылған бағдарламалар Windows 7, 8 және XP жүйелерінде жұмыс істейді.
Мәтінді тану жетекшісі - ABBYY Finereader
Сіздердің көпшілігіңіз FineReader туралы білетін шығарсыздар (Fine Reader). Бұл бағдарлама орыс тіліндегі мәтіндерді сапалы тану үшін ең жақсы немесе ең жақсысы. Бағдарлама ақылы және үйде пайдалануға арналған лицензия бағасы 2000 рубльден сәл төмен. Сондай-ақ, FineReader-дің алғашқы нұсқасын жүктеп алуға немесе ABBYY Fine Reader Online-да онлайн режимінде мәтінді тануды қолдануға болады (сіз бірнеше бетті ақысыз, содан кейін ақыға тани аласыз). Мұның бәрі әзірлеушінің ресми сайтында //www.abbyy.ru.
FineReader нұсқасын орнату ешқандай қиындық тудырмады. Бағдарламалық жасақтама тануды жеңілдету үшін Microsoft Office және Windows Explorer-мен біріктіре алады. Тегін сынақ нұсқасының шектеулері 15 күнді пайдалану және 50 беттен аспайтын тану мүмкіндігін қамтиды.
Тану бағдарламаларын тестілеуге арналған сурет
Менде сканер жоқ болғандықтан, тексеру үшін төмен сапалы телефон камерасынан суретті пайдаланып, контрастты сәл өңдедім. Сапасы түкке тұрғысыз, оны кім шеше алатынын көрейік.
FineReader мәзірі
FineReader мәтіннің графикалық кескінін тікелей сканерден, кескін файлдарынан немесе камерадан ала алады. Менің жағдайда, сурет файлын ашу жеткілікті болды. Нәтиже қуантты - бірнеше қате жіберілді. Айта кету керек, бұл осы үлгімен жұмыс жасау кезінде барлық тексерілген бағдарламалардың ең жақсы нәтижесі - тану сапасы тек Free Online OCR ақысыз онлайн қызметінде болды (бірақ бұл шолуда біз тек онлайн-тану туралы емес, бағдарламалық құралдар туралы ғана айтамыз).
FineReader-де мәтінді тану нәтижесі
Ашығын айтқанда, FineReader-де кириллица мәтіндеріне бәсекелестер жоқ шығар. Бағдарламаның артықшылықтары тек мәтінді тану сапасы ғана емес, сонымен қатар кең функционалдылық, форматтауды қолдау, Word форматына, pdf және басқа да функцияларды қоса көптеген форматтарға сауатты экспорттау. Осылайша, егер OCR міндеттері сіз үнемі кездесетін нәрсе болса, онда аз мөлшерде ақша жұмсамаңыз, ол ақтайды: сіз FineReader-де сапалы нәтижеге қол жеткізе отырып, көп уақытты үнемдейсіз. Айтпақшы, мен ештеңені жарнамаламаймын - мен оннан астам парақты тануды қажет ететіндер осындай бағдарламалық жасақтаманы сатып алу туралы ойлануы керек деп ойлаймын.
CuneiForm - Мәтінді еркін тану бағдарламасы
Менің ойымша, Ресейдегі екінші танымал OCR бағдарламасы - бұл CuneiForm ақысыз, оны ресми сайтынан жүктеп алуға болады //cognitiveforms.ru/products/cuneiform/.
Бағдарламаны орнату да өте қарапайым, ол кез-келген үшінші тараптың бағдарламалық жасақтамасын орнатуға тырыспайды (мысалы, көптеген тегін бағдарламалар). Интерфейс қысқа әрі түсінікті. Кейбір жағдайларда шеберді қолданудың ең қарапайым тәсілі, ол үшін мәзірдегі белгішелердің біріншісіне арналған.
Мен FineReader-де қолданған үлгіні жеңе алмағаным, дәлірек айтқанда, нашар оқылатын және сөздердің қысқаша мазмұнын шығарған. Екінші әрекет осы бағдарламаның сайтындағы мәтіннің скриншотымен жасалды, алайда оны ұлғайту керек болды (200 дюйм және одан жоғары ажыратымдылықпен сканерлеуді қажет етеді, шрифт жолының қалыңдығы 1-2 пиксельді құрайтын скриншоттарды оқымайды). Мұнда ол өте жақсы болды (мәтіннің бір бөлігі танылмады, өйткені тек орыс тілі таңдалды).
CuneiForm-та мәтінді тану
Осылайша, CuneiForm - бұл сіз тырысуыңыз керек деп болжай аламыз, әсіресе егер сізде жоғары сапалы сканерленген беттер болса және сіз оларды тегін танығыңыз келсе.
Microsoft OneNote - сізде бар бағдарлама
Microsoft Office-тің 2007 нұсқасынан бастап, 2013 жылғы нұсқасымен аяқталатын жазбаларында OneNote бағдарламасы бар. Сонымен қатар, мәтінді тану ерекшеліктері бар. Оны пайдалану үшін жай ғана сканерленген немесе мәтіннің кез-келген кескінін нотаға салып, тінтуірдің оң жақ батырмасымен нұқып, контекстік мәзірді пайдаланыңыз. Әдепкі тану тілі ағылшын тіліне қойылғанын ескеремін.
Microsoft OneNote бағдарламасында тану
Мәтін өте жақсы танылды деп айта алмаймын, бірақ менің білуімше, бұл CuneiForm-қа қарағанда әлдеқайда жақсы. Бағдарламаның артықшылығы, жоғарыда айтылғандай, оның ықтималдығы жоғары, ол сіздің компьютеріңізге орнатылған. Қарапайым сканерленген құжаттармен жұмыс істеу қажет болса, әрине, оны пайдалану ыңғайлы емес, бірақ бұл визиткалық карталарды тез тануға ыңғайлы.
OmniPage Ultimate, OmniPage 18 - өте керемет нәрсе болуы керек
Бағдарламаның OmniPage мәтінін тану үшін қаншалықты жақсы екенін білмеймін: сынақ нұсқалары жоқ, бір жерге жүктегім келмейді. Бірақ, егер оның бағасы негізделген болса және Ultimate емес, жеке қолдануға арналған нұсқада 5000 рубльге дейін шығындалатын болса, онда бұл әсерлі нәрсе болуы керек. Бағдарлама парағы: //www.nuance.com/for-individuals/by-product/omnipage/index.htm
OmniPage бағдарламалық жасақтамасының бағасы
Егер сіз сипаттамалармен және шолулармен, оның ішінде орыс тіліндегі басылымдармен таныссаңыз, онда OmniPage шынымен де сапалы және дәл танылуын қамтамасыз етеді, оның ішінде орыс тілінде де салыстырмалы түрде төмен сападағы сканерлерді салыстырады және қосымша құралдар жиынтығын ұсынады. Кемшіліктердің ішінен интерфейс әсіресе ыңғайлы емес, әсіресе жаңадан келген пайдаланушы үшін. Бұл OmniPage батыс нарығында қандай-да бір жолмен FineReader-тің тікелей бәсекелесі және ағылшын рейтингтерінде олар дәл өзара күреседі, сондықтан менің ойымша, бағдарлама лайықты болуы керек.
Бұл барлық осы типтегі бағдарламалар емес, сонымен қатар кішігірім ақысыз бағдарламалардың әртүрлі нұсқалары бар, бірақ олармен тәжірибе жасау кезінде мен оларға тән екі негізгі кемшіліктерді таптым: кириллицалық қолдаудың жоқтығы немесе орнату жиынтығында әр түрлі, өте пайдалы емес бағдарламалар, сондықтан оларды айтпауды шештім. міне.