"Прикладное программное обеспечение: системы автоматической обработки текстов" - читать интересную книгу автора3.2.3.1. Орфографический контрольПрограммы орфографического контроля обнаруживают (и предлагают варианты исправления) мотивированные грамматические ошибки в основах и окончаниях (флексиях) слов, записанных в словарь системы, и слов, встретившихся ей впервые (незнакомых), а также случайные, или немотивированные, ошибки. Основные классы учитываемых случайных ошибок таковы: – пропуск одной буквы ( – одна лишняя буква ( – замена одной буквы ( – перестановка двух соседних букв ( Признаком ошибки служит появление в обрабатываемом тексте формы незнакомого системе слова. Предпринимается попытка "свести" такое незнакомое слово к знакомому с помощью преобразований, обратных перечисленным выше (считается, что ошибка могла возникнуть в результате одного из таких "прямых" преобразований знакомого слова). Для предварительной оценки близости слов (основ слов) используется специально разработанная метрика. Одна из программ обнаруживает ошибки в датах, задаваемых в тексте с помощью конструкций вида ДД.ММ.ГГ. Если задан и диапазон возможных дат, проверяется также принадлежность всех представленных в исследуемом тексте дат этому диапазону. Примеры работы программ: прочитанна - ОШИБКА В СЛОВОИЗМЕНЕНИИ ! ОЖИДАЕМОЕ СЛОВО: прочитана рассчета - ВОЗМОЖНА ОШИБКА ТИПА "удвоение буквы" ОЖИДАЕМОЕ СЛОВО : расчета 10.25.89. ОШИБКА В ДАТЕ - недопустимая дата: месяц: 25 |
|
|