Книга Памяти

Перевод печатной «Книги Памяти» в формат базы данных

Электронная версия «Книги Памяти»: работа продолжается

На сайте «Родная Вятка» продолжается работа по оцифровке «Книг Памяти» по Кировской области, Удмуртской республике, Республике Марий Эл и ряду других территорий, относящихся к географии портала. К настоящему времени в базу данных добавлено 232015 записей о людях (обработано 41% от общего числа страниц), в том числе  190595 по Кировской области (68%), 23719 по Удмуртии (18%), 7367 по Марий Эл (11%), 10334 по Татарстану (31%).

Вся работа выполняется на добровольных началах активными пользователями сайта «Родная Вятка». Приглашаем участвовать всех, кто хотел бы помочь в реализации этого проекта!

Книга Памяти Кировской области переведена в формат базы данных

Дорогие посетители портала «Родная Вятка»! 75 лет прошло со дня окончания Великой Отечественной войны — тяжелейшей войны в истории нашей Родины. Сегодня мы вспоминаем эти исторические события  и воздаём почести ветеранам, нашим родным, землякам, соотечественникам, воевавшим на фронтах и творившим Победу в тылу. Их Подвиг — бесценен! Поздравляем всех с праздником Великой Победы! Желаем всем мирного неба и крепкого здоровья!

В этот день мы сообщаем о хорошей новости — на нашем сайте завершена оцифровка и публикация списков воинов из Книги Памяти Кировской области!

Сегодня в базу данных сайта были загружены данные из остававшихся томов. Все эти списки доступны для полнотекстового поиска на нашем сайте. Ранее эта работа была завершена также для Книги Памяти Удмуртской Республики. Таким образом, участниками проекта полностью обработаны Книги Памяти двух регионов. Ознакомиться с материалами можно в разделе «Книга Памяти» (меню «Персоналии»).

Напоминаем, что на портале «Родная Вятка» можно самостоятельно разместить страницу о вашем предке — участнике Великой Отечественной войны в разделе «Персоналии». Вы можете указать биографию воина, приложить документы, сделать привязку к населённым пунктам и записям Книг Памяти.

Вся «Книга Памяти» Удмуртской Республики теперь доступна в электронном виде на сайте «Родная Вятка»

В преддверии 74-й годовщины Великой Победы у нас отличная новость – полностью оцифрована и внесена в базу данных сайта «Родная Вятка» Книга Памяти Удмуртской Республики. В рамках проекта было выполнено распознавание всех 9 томов Книги Памяти, вышедших из печати в 1993–2000 гг. Обработке подлежали данные о внесенных в Книгу уроженцах и жителях Удмуртии, погибших, умерших от ран и пропавших без вести в годы Великой Отечественной войны, вооруженных конфликтах 1938-1939 гг., в Чеченской Республике и Республике Дагестан. Всего в базу внесено 137.794 записи. Поиск по базе доступен по ссылке: https://rodnaya-vyatka.ru/kniga-pamyati.

Отметим, что всю работу по распознаванию Книги Памяти УР выполнил один человек – Виктор Васильевич Щербань, модератор и активист «Родной Вятки». От имени портала выражаем Виктору благодарность за этот огромный труд, за его целеустремленность и ответственный подход к делу.

Массовая привязка записей Книги памяти Удмуртии

Нужна помощь людей, который хотя бы поверхностно ориентируется в географии нижеперечисленных районов, для массовой привязки записей Книги Памяти.

Привязка Книги Памяти: Кирово-Чепецкий, Пижанский, Подосиновский и Санчурский районы (требуется помощь)

Предлагаю выполнить привязку Книги Памяти по 4-м районам, недавно добавленным на сайт (нужна помощь, желательно знатоков местной географии или опытных пользователей РВ):

Раздел «Книга Памяти» обновлён и пополнен

В разделе «Книга Памяти» выполнены важные изменения, направленные на повышение качества формируемой базы данных по погибшим и пропавшим без вести участникам Великой Отечественной войны. В структуру раздела включён список томов Книги Памяти, по которым планируется оцифровка, охватывающий всю географию портала. По каждому тому приведена текущая статистика по оцифровке страниц и геопривязке записей, что позволяет контролировать состояние работы. Аналогичная статистика добавлена к указателю по районам. Для всех записей Книги Памяти сейчас является обязательным указание ссылки на том, номер страницы, район, просмотр сканов на сайте ОБД «Мемориал».

На данный момент на сайт добавлено 25% от общего объёма страниц Книг Памяти, планируемых к обработке (5369 из 21144). Всего в базу внесено 147217 записей. Для 49% добавленных записей выполнена геопривязка (персоны связаны с населёнными пунктами, где они родились или проживали).

В преддверии Дня защитника Отечества и очередной годовщины Великой Победы, обращаемся к посетителям сайта с просьбой активнее включаться в работу над Книгой Памяти. Выберите один из районов или томов и сообщите нам на форуме «Работа над Книгой Памяти» о желании взять материал в обработку. Благодарим всех, кто уже участвует в этой работе!

Книги Памяти. Часть 3.

Нумерация страниц.

Образец файла. Первая колонка содержит исходный текст, полученный после FineReader. Вторая – простановка номеров страниц для каждой записи. Третья – проверка совпадает ли первый символ текущей строки с первым символом следующей строки.

Книги Памяти. Часть 2.

Не уверен, что нужно отдельно останавливаться на работе FineReader, инструкций в интернете огромное количество, перечислю только важные моменты.

В настройках меняем язык, вместо «Русский и английский» указываем только «Русский», таким образом мы предотвращаем ситуации, когда фамилии, имена или отчества частично набраны кириллицей, частично латиницей. «Иванов» и «Ивaнoв» выглядят одинаково, но в поиске второго Иванова найти не получится.

Книги Памяти. Часть 1.

Некоторое время назад, обещал написать инструкцию, по обработке Книг Памяти. Пошаговой инструкции не получится, так как даже в пределах одного тома структура данных районов может различаться. Постараюсь описать действия подробней, чтобы был понятен алгоритм и можно было подстроиться под локальные особенности конкретного района.

В некоторых вопросах, у меня не хватает знаний, поэтому решения не всегда оптимальные, буду рад советам/исправлениям. Ниже, трудозатраты для каждого из этапов указаны на примере Можгинского района (200 страниц, 8000 записей). Итак, основные этапы:

Страницы