Давайте сделаем каталог микрофильмов на FamilySearch!

Друзья! Пару месяцев назад я опубликовал новость о том, что решил начать работу по обработке переписных листов Первой всеобщей переписи населения 1897 г. Вятской губернии, которые опубликованы на портале FamilySearch. Был создан раздел с поиском населённых пунктов по заголовку дел, сделана опись страниц. Раздел помогает найти интересующий населённый пункт и сразу перейти на нужное дело на FamilySearch. Пользователи нашего портала довольно хорошо отозвались об этой затее.

Пока что какой-либо оцифровки переписных листов переписи 1897 года не ведётся, но эта работа планируется в отдалённом будущем, хотя и не поставлена в список текущих задач.

Но я решил идти дальше и сделать более удобный поиск дел по всем микрофильмам FS, которые так или иначе связаны с Вятской землёй. Главная проблема заключается в том, что все микрофильмы опубликованы в разных каталогах, ищутся по совершенно разным ключевым словам и тематическим разделам. Мне не удалось найти какой-то единый каталог со списком, скажем, всех оцифрованных микрофильмов, содержащих дела из Центрального Госархива Удмурсткой Республики и Центрального Госархива Республики Татарстан. Но, тем не менее, были найдены 3144 микрофильма, содержащие дела, так или иначе связанные с географией нашего портала.

При таком объёме микрофильмов количество снимков идёт на миллионы.

Предлагаю общими усилиями заняться составлением описи дел 3144 микрофильмов! Требуется помощь в первую очередь тех, кто уже разобрался в запутанной структуре FS.

Я выгрузил необходимые списки каталогов и дел с FS.

На данный момент мы имеем:

999 каталогов микрофильмов — на FS они называются «Авторы» или «Темы» (пример).

16 614 так называемых Item в этих 999 каталогах. Item — это части микрофильмов, содержащие архивное дело целиком, либо его часть.

Из этих 16+ тысяч Items 10 638 содержатся в интересующих нас микрофильмах. Все остальные Items в этих каталогах от других микрофильмов, которые нам не нужны. Почему же так? Приведу пример: Есть каталог Ревизские сказки, 1762-1858 (Main Author: Тула (Тула). Губернская казенная палата). Нас интересует только самый последний микрофильм 7576141, в котором с 519 по 546 страницу содержится дело 154-8-1015 «Ревизские сказки Вятской губернии, 1858» из фонда 154 «Ревизские сказки, выделенные из подлинных дел Ревизского отделения. О разных переселённых крестьянах (дела 997-1028)» [ссылка]. Так как я выгружал с FS список всех Items из всех каталогов с «нашими» 3144 микрофильмов, соответственно в выгруженных данных присутствуют тысячи «ненужных» записей.

Из оставшихся 10 638 ещё некоторая часть выпадет в процессе описания дел. Как в примере выше: нам нужен лишь один Item из микрофильма 7576141 — это дело 154-8-1015, всё остальное в этом микрофильме — не наше.

Какая требуется помощь?

Самое первоочередное — это обработка таблиц со списками «наших» 999 каталогов и 10 638 Items. Иногда заголовок каталога написан по-английски, иногда по-русски, а иногда в сложной транслитерации, типа: Spasskai︠a︡ T︠S︡erkov', Glazovkogo uezda, Vi︠a︡tskoĭ gubernii. В последнем случае я уже произвёл автоматический перевод в кириллицу, получилось довольно неплохо. Например, в этом примере вышло: Спасская Церковь, Глазовкого уезда, Вятской губернии. Почти идеально, не считая пропущенную букву в слове Глазовкого. Однако не везде текст получился таким хорошим.

Думаю, в новом разделе для всех модераторов и активистов будет организована возможность для каждого дела указать действительный заголовок и диапазон номеров страниц. В итоге мы должны получить что-то типа этого: https://rodnaya-vyatka.ru/perepis-1897, но уже не только по переписи 1897 года.

Но перед публикацией списка нужно провести хоть какую-то обработку имеющихся заголовков дел. Кто готов принять участие в этой работе?

Да, чуть не забыл, из этих 3144 микрофильмов 377 содержат данные переписи 1897 года, так что по ним каталог (или опись — кому как больше нравится) мною уже был сделан.

PS: всех поздравляю, сегодня на сайт за всё время его существования зашёл 1 700 000-ый посетитель!

Комментарии

Аватар пользователя Bortnikov_Fedor

Речь идет о том, что стали недоступными папки с пленками на Google-диске. сам FS как был доступен через VPN, так и продолжает быть доступным

Заблокировали аккаунт Google.\"Каждому исследователю неплохо было бы копировать файлы на свое личное облако и при этом писать на форуме в региональных темах или в своем дневнике подробный перечень залитых документов, название церкви, географическое положение, АТД, фамилии жителей и т.д. Функция поиска по сайту и даже в обычных поисковиках творит чудеса\" Это сообщение на сайте от Адмирала21 .По Удмуртии о старообрядцах сохранил на дисках, по возможности буду помогать.

  По просьбе Ольга краевед -Можете поделиться метрическими книгами Благовещенского собора г. Воткинска? Мне нужен 1919 год.  Выкладываю на некоторое время  https://yadi.sk/d/n599OeWBEvyK7w

Страницы