розпізнавання

Безкоштовні розпізнавалки текстів (українською мовою): cuneiform, ocrodjvu

ocrodjvu = OCRopus (tesseract) + DJVU

ocrodjvu - це невеличка програма, що використовує OCRopus для розпізнавання файлів DJVU, що не мають текстової інформації (лише зображення). За допомогою ocrodjvu можна або створити новий DJVU-файл (причому доступні як bundled, так і single-page варіанти), або додати текст до існуючого файлу.

Розпізнавання мови: пакет від CMU

Два місяці тому я писав про використання програми Julius (з відкритим вихідним кодом) для розпізнавання усної української мови.

Розпізнавання усної української мови

Виявляється, проблему розпізнавання усної української мови хтось-таки намагається вирішувати - надибав відповідну статтю (також приєдную її до цього повідомлення, на випадок якщо оригінал стане недоступним).

Підсумовуючи викладене в статті: розпізнавання української усної мови вже сьогодні - це реальність! І програма є (Julius, 6-те літературне посилання), і десь автори взяли великого обсягу набір начитаних 100 дикторами 30 000 слів, та тексти на 250 МіБ.

Збір матеріалів