argon bulletin board

Експертно търсене  

Новини:

Регистрирането на нови потребители е временно деактивирано.

Автор Тема: OCR от видео файл  (Прочетена 1010 пъти)

Kozhuharov

  • Неактивен Неактивен
  • Публикации: 4
OCR от видео файл
« -: 11.10.2010, 12:09:14 »

Здравейте, искам да попитам дали някой може да ми помогне с някаква информация ( учебник или нещо подобно ) за разпознаването на текст в дадена област от видео файл ?
Активен
Учението е злато,но аз не съм алчен.....

Neo

  • Неактивен Неактивен
  • Публикации: 15
Re:OCR от видео файл
« Отговор #1 -: 12.10.2010, 23:11:38 »

Ами може да направиш скрийншотове на съответните моменти от видеото, където има текст, и след това на тях да им пуснеш OCR.
Активен

jdbc

  • Неактивен Неактивен
  • Публикации: 14
Re:OCR от видео файл
« Отговор #2 -: 14.10.2010, 16:18:23 »

Здравейте, искам да попитам дали някой може да ми помогне с някаква информация ( учебник или нещо подобно ) за разпознаването на текст в дадена област от видео файл ?
Чичко Google зане всичко!  8-)
http://citeseerx.ist.psu.edu/viewdoc/download?doi=10.1.1.89.8365&rep=rep1&type=pdf
http://www.sri.com/esd/automation/video_recog.html

Струва ми се, че разпознаването от скрийншотове може и да не е много ефикасно - от една страна е хамалогия, но дори и да се автоматизира, общо-разпространените OCR пакети си искат маса пиксели, т.е. изображения с висока резолюция. Съмнявам се някви "дребни" букви които в скрийншота са изобразени в квадрат със страна, например, по 10-15 пиксела да бъдат разпознати. Може би , ако се приложи няква междинна обработка преди подаването на скрийншота към OCR , нещата може и да се подобрят. Нямам идея обаче каква да е межд. обработка, съмнявам се простия ъпскейлинг да оправи нещата, може би трябва да се направи нещо след него(шарп?) - тук само предполагам.
На втория линк са обобщили ситуацията тъй:
"This optical character recognition (OCR) for text within imagery and video requires a more specialized approach than is provided by off-the-shelf OCR software, which is designed primarily for recognizing text within documents. "
Активен