Мәтінді тануға арналған онлайн қызметтер

Pin
Send
Share
Send

Блогтың барлық оқырмандарына сәлем!

Менің ойымша, көбінесе компьютерде жұмыс жасайтындар (ойнамайды, дәлірек айтсақ) мәтінді танумен айналысады. Мысалы, сіз кітаптан үзінді сканерледіңіз, енді бұл бөлімді құжатыңызға салуыңыз керек. Бірақ сканерленген құжат - бұл сурет, ал бізге мәтін керек - ол үшін бізге суреттерден мәтінді тану үшін арнайы бағдарламалар мен ғаламтор қызметтері қажет.

Тану бағдарламалары туралы мен алдыңғы хабарламаларда жаздым:

- мәтінді сканерлеу және FineReader-де тану (ақылы бағдарлама);

- FineReader - CuneiForm аналогтарында жұмыс жасау (тегін бағдарлама).

Сол мақалада мен мәтінді тануға арналған интернеттегі қызметтерге тоқталғым келеді. Егер сізге 1-2 суреттен тұратын мәтінді тез арада алу керек болса - әр түрлі бағдарламаларды орнатудың қажеті жоқ ...

 

Маңызды! Тану сапасы (қателер саны, оқылым және т.б.) суреттің бастапқы сапасына байланысты. Сондықтан, сканерлеу кезінде (суретке түсіру және т.б.), мүмкіндігінше жоғары сапаны таңдаңыз. Көп жағдайда 300-400 dpi сапасы жеткілікті болады (dpi - бұл кескін сапасын сипаттайтын параметр. Барлық сканерлердің параметрлерінде әдетте бұл параметр көрсетіледі).

 

Онлайн қызметтер

Қызметтердің қалай жұмыс істейтінін көрсету үшін мен мақалаларымның біреуінің скриншотын түсірдім. Бұл скриншот сипаттамалары төменде көрсетілген барлық қызметтерге жүктеледі.

1) //www.ocrconvert.com/

Маған бұл қызмет өте қарапайым болғандықтан ұнайды. Сайт ағылшынша болғанымен, орыс тілімен жақсы жұмыс істейді. Тіркелудің қажеті жоқ. Тануды бастау үшін 3 әрекетті орындау керек:

- кескінді жүктеу;

- суреттегі мәтіннің тілін таңдаңыз;

- тануды бастау түймесін басыңыз.

Форматтарды қолдау: PDF, GIF, BMP, JPEG.

Нәтижесі төменде суретте көрсетілген. Айту керек, мәтін жақсы танылған. Сонымен қатар, өте тез - мен 5-10 секунд күттім.

 

2) //www.i2ocr.com/

Бұл қызмет жоғарыда айтылғандай жұмыс істейді. Мұнда сіз файлды жүктеп алып, тану тілін таңдап, мәтіннен үзінді түймесін басуыңыз керек. Қызмет өте жылдам жұмыс істейді: 5-6 секунд. бір бет.

Қолдау көрсетілетін форматтар: TIF, JPEG, PNG, BMP, GIF, PBM, PGM, PPM.

Интернеттегі қызметтің нәтижесі әлдеқайда ыңғайлы: сіз бірден екі терезені көресіз - біріншісінде, тану нәтижесі, екіншісінде - түпнұсқа кескін. Сондықтан, өңдеген кезде түзетулер жасау оңай. Айтпақшы, қызметке тіркелудің де қажеті жоқ.

 

 

3) //www.newocr.com/

Бұл қызмет бірнеше жолмен ерекше. Біріншіден, ол «жаңа пішінді» DJVU форматын қолдайды (айтпақшы, форматтардың толық тізімі: JPEG, PNG, GIF, BMP, TIFF, PDF, DjVu). Екіншіден, суреттегі мәтін аумақтарын таңдауды қолдайды. Бұл суреттегі тек мәтіндік аумақтарды ғана емес, сонымен қатар сіз танып білу қажет емес сызбалық аймақтарды да тапқан кезде өте пайдалы.

Тану сапасы орташа деңгейден жоғары, тіркелудің қажеті жоқ.

 

4) //www.free-ocr.com/

Тану үшін өте қарапайым қызмет: суретті жүктеп, тілді көрсетіңіз, captcha енгізіңіз (айтпақшы, осы жерде осы қызмет жасалатын жалғыз қызмет) және суретті мәтінге аудару үшін батырманы басыңыз. Іс жүзінде бәрі!

Қолдау көрсетілетін форматтар: PDF, JPG, GIF, TIFF, BMP.

 

Тану нәтижесі орташа. Қателер бар, бірақ көп емес. Алайда, егер түпнұсқа скриншоттың сапасы жоғары болса, қателіктердің саны аз болады.

PS

Мұның бәрі бүгін. Егер сіз мәтінді танудың қызықты қызметтерін білсеңіз - түсініктемелерде бөлісіңіз, мен ризамын. Бір шарт: тіркеудің қажеті жоқ, қызмет тегін.

Барлық жақсы!

Pin
Send
Share
Send