Мәтінді тану. Тегін бағдарлама - FineReader аналогы

Pin
Send
Share
Send

Ерте ме, кеш пе, кеңсе бағдарламаларымен жұмыс істейтіндердің бәріне әдеттегі міндет қойылады - кітаптан, журналдан, газеттен мәтіндерді сканерлеу, содан кейін бұл суреттерді мәтіндік форматқа, мысалы, Word құжатына аудару.

Мұны істеу үшін сізге сканер және мәтінді тану үшін арнайы бағдарлама қажет. Бұл мақалада FineReader-тің тегін серіктесі қарастырылады -Сына жазуы (FineReader-де тану туралы - осы мақаланы қараңыз).

Енді бастайық ...

Мазмұны

  • 1. CuneiForm бағдарламасының ерекшеліктері, ерекшеліктері
  • 2. Мәтінді танудың мысалы
  • 3. Пакеттік мәтінді тану
  • 4. Қорытындылар

1. CuneiForm бағдарламасының ерекшеліктері, ерекшеліктері

Сына жазуы

Сіз оны әзірлеуші ​​сайтынан жүктей аласыз: //cognitiveforms.com/

Ашық мәтінді тану бағдарламасы. Сонымен қатар, ол Windows-тың барлық нұсқаларында жұмыс істейді: XP, Vista, 7, 8, бұл қуантады. Сонымен қатар, бағдарламаның толық орыс тіліндегі аудармасын қосыңыз!

Таразы:

- мәтінді әлемнің ең танымал 20 тілінде тану (ағылшын және орыс тілдерінде осы нөмірге өздігінен қосылады);

- әр түрлі баспа қаріптеріне үлкен қолдау;

- танылған мәтіннің сөздігін тексеру;

- жұмыс нәтижелерін бірнеше жолмен сақтау мүмкіндігі;

- құжат құрылымын сақтау;

- Үлкен қолдау және үстелді тану.

Жаман тұстары:

- тым үлкен құжаттар мен файлдарды қолдамайды (400 нүктеден көп);

- сканерлердің белгілі бір түрлерін тікелей қолдамайды (бұл үлкен мәселе емес, сканер драйверлеріне арнайы сканер бағдарламасы кіреді);

- дизайн жарқырамайды (бірақ бағдарлама мәселені толығымен шешетін болса, оған кім қажет).

2. Мәтінді танудың мысалы

Сіз тану үшін қажетті суреттерді алдыңыз деп ойлаймыз (интернетте сканерленген немесе кітапты pdf / djvu форматында жүктеп, олардан қажетті суреттерді алып тастағансыз. Мұны қалай істеуге болатындығы туралы осы мақаланы қараңыз).

1) CuineForm бағдарламасында қалаған суретті ашыңыз (файл / ашық немесе «Cntrl + O»).

2) Тануды бастау үшін - алдымен әр түрлі аймақтарды таңдау керек: мәтін, суреттер, кестелер және т.с. автоматты түрде! Ол үшін терезенің жоғарғы панеліндегі «орналасу» түймесін басыңыз.

3) 10-15 секундтан кейін. Бағдарлама әр түрлі түстермен барлық аймақтарды автоматты түрде бөледі. Мысалы, мәтін аймағы көк түспен ерекшеленеді. Айтпақшы, ол барлық бағыттарды тез және тез бөліп көрсетті. Шынымды айтсам, мен оның мұндай тез әрі дұрыс реакциясын күтпедім ...

4) Автоматты орналасуға сенбейтіндер үшін қолмен қолдануға болады. Мұны істеу үшін құралдар тақтасы бар (төмендегі суретті қараңыз), соның арқасында сіз таңдай аласыз: мәтін, кесте, сурет. Бастапқы кескінді жылжытыңыз, үлкейтіңіз / кішірейтіңіз, шеттерін кесіңіз. Жалпы, жақсы жиынтық.

5) Барлық аймақтар белгіленгеннен кейін, біз өтуге болады тану. Ол үшін төмендегі суреттегідей батырманы шертіңіз.

6) 10-20 секунд ішінде сөзбе-сөз. Сіз Microsoft Word-та танылған мәтіні бар құжатты көресіз. Бір қызығы, бұл мысал үшін мәтінде, әрине, қателіктер болды, бірақ олар өте аз! Сонымен қатар, бастапқы материал қандай сапада болғанын қарастыру - сурет.

Жылдамдық пен сапаны FineReader-мен салыстыруға болады!

3. Пакеттік мәтінді тану

Бұл бағдарлама сізге бір емес, бірнеше суретті тану қажет болған кезде ыңғайлы болуы мүмкін. Топтаманы тануға арналған сілтеме әдетте бастау мәзірінде жасырылады.

1) Бағдарламаны ашқаннан кейін сізге жаңа пакет жасау керек немесе бұрын сақталған пакетті ашу керек. Біздің мысалда жаңасын жасаңыз.

2) Келесі қадамда біз оған атау береміз, жақсырақ алты айдан кейін онда сақталған нәрсені еске түсіреміз.

3) Содан кейін құжаттың тілін таңдаңыз (орысша-ағылшынша), сканерленген материалда суреттер мен кестелер бар-жоғын көрсетіңіз.

4) Енді тану үшін файлдар орналасқан қалтаны көрсету керек. Айтпақшы, қызықты, бағдарламаның өзі барлық суреттер мен басқа да графикалық файлдарды таба алады, оларды жобаға қосады. Тек артықты алып тастау керек.

5) Келесі қадам маңызды емес - танылғаннан кейін бастапқы файлдармен не істеу керектігін таңдаңыз. «Ештеңе жасамаңыз» құсбелгісін қоюды ұсынамын.

6) Танылған құжат сақталатын форматты таңдау ғана қалады. Бірнеше нұсқа бар:

- rtf - барлық танымал кеңселер ашқан сөздік құжаттағы файл (ақысыз, бағдарламаларға сілтеме қоса);

- txt - мәтіндік формат, онда тек мәтін сақтауға болады, суреттер мен кестелер болмайды;

- htm - гипермәтіндік бет, егер сіз сайттың файлдарын сканерлеп, танысаңыз, ыңғайлы. Біз оны біздің мысалда таңдаймыз.

7) «Аяқтау» түймесін басқаннан кейін жобаңызды өңдеу процесі басталады.

8) Бағдарлама өте жылдам жұмыс істейді. Танудан кейін сіздің алдыңызда htm файлдары бар қойынды пайда болады. Егер сіз осындай файлды шертсеңіз, нәтижелерді көруге болатын шолғыш іске қосылады. Айтпақшы, пакетті онымен одан әрі жұмыс істеу үшін сақтауға болады.

9) Көріп отырғаныңыздай, нәтижелері жұмыс өте әсерлі. Бағдарлама суретті оңай таныды, ал оның астындағы мәтін оңай танылды. Бағдарлама ақысыз болғанына қарамастан, бұл өте керемет!

4. Қорытындылар

Егер сіз құжаттарды жиі сканерлемесеңіз және танымасаңыз, онда FineReader бағдарламасын сатып алудың мағынасы жоқ шығар. Көптеген тапсырмаларды CuneiForm оңай шешеді.

Екінші жағынан, оның кемшіліктері де бар.

Біріншіден, нәтижені өңдеуге және тексеруге арналған құралдар аз. Екіншіден, көптеген суреттерді тану керек болған кезде, FineReader-де жобаға қосылғанның бәрін оң жақтағы бағаннан бірден көру ыңғайлы: қажетсіздерді тез алып тастаңыз, түзетулер енгізіңіз және т.с.с. үшіншіден, CuneiForm құжаттарда тану ретінде жоғалады: Мен құжатты еске түсіруім керек - қателерді түзету, тыныс белгілерін, тырнақша қою және т.б.

Мұның бәрі. Сіз мәтінді тануға арналған басқа лайықты бағдарламаны білесіз бе?

Pin
Send
Share
Send