розпізнавання |
ocrodjvu = OCRopus (tesseract) + DJVU ocrodjvu - це невеличка програма, що використовує OCRopus для розпізнавання файлів DJVU, що не мають текстової інформації (лише зображення). За допомогою ocrodjvu можна або створити новий DJVU-файл (причому доступні як bundled, так і single-page варіанти), або додати текст до існуючого файлу.
|
|||
Два місяці тому я писав про використання програми Julius (з відкритим вихідним кодом) для розпізнавання усної української мови.
|
|||
Виявляється, проблему розпізнавання усної української мови хтось-таки намагається вирішувати - надибав відповідну статтю (також приєдную її до цього повідомлення, на випадок якщо оригінал стане недоступним). Підсумовуючи викладене в статті: розпізнавання української усної мови вже сьогодні - це реальність! І програма є (Julius, 6-те літературне посилання), і десь автори взяли великого обсягу набір начитаних 100 дикторами 30 000 слів, та тексти на 250 МіБ.
|
|||