Блог пользователя Виктор_В

Книги Памяти. Часть 3.

Нумерация страниц.

Образец файла. Первая колонка содержит исходный текст, полученный после FineReader. Вторая – простановка номеров страниц для каждой записи. Третья – проверка совпадает ли первый символ текущей строки с первым символом следующей строки.

Книги Памяти. Часть 2.

Не уверен, что нужно отдельно останавливаться на работе FineReader, инструкций в интернете огромное количество, перечислю только важные моменты.

В настройках меняем язык, вместо «Русский и английский» указываем только «Русский», таким образом мы предотвращаем ситуации, когда фамилии, имена или отчества частично набраны кириллицей, частично латиницей. «Иванов» и «Ивaнoв» выглядят одинаково, но в поиске второго Иванова найти не получится.

Книги Памяти. Часть 1.

Некоторое время назад, обещал написать инструкцию, по обработке Книг Памяти. Пошаговой инструкции не получится, так как даже в пределах одного тома структура данных районов может различаться. Постараюсь описать действия подробней, чтобы был понятен алгоритм и можно было подстроиться под локальные особенности конкретного района.

В некоторых вопросах, у меня не хватает знаний, поэтому решения не всегда оптимальные, буду рад советам/исправлениям. Ниже, трудозатраты для каждого из этапов указаны на примере Можгинского района (200 страниц, 8000 записей). Итак, основные этапы:

Орфография

У меня больше тройки по русскому в школе никогда не было. Да и сейчас орфографических ошибок делаю кучу. Видимо по этому крестьянские рукописные тексты вызывают восторг, по другому свои эмоции описать не смогу )

Заявление моего прадеда:

Я гр-н Колпаков в 1930 г раскулачен как занимавшись мой 2-ой сын торговлей по базарам свозу по патенту 2 разряда. Но експлатасию чужого труда неимел выселен из пределов своева раиона или области не был как сам не семья.