Опубликовано чт, 21/06/2018 - 17:10 пользователем TKalinin
Занимался тут изучением распространения фамилий и в качестве побочного продукта представляю карту наиболее распространенных фамилий Кировской области и окрестностей по постоянию на начало XX века.
Усреднение производилось:
- по районам и крупным городам - это тёмно-синий цвет маркеров;
- а также по областям - это тёмно-красный цвет маркеров.
От данной карты какой-либо прямой пользы не вижу, но в чём-то она является интересной - вот и решил поделиться.
Комментарий: карта перезалита, так как в предыдущем месте перестала открываться.
Ну, за "самая распространённая фамилия Татарстана - Иванов" татары наверное обидятся, но тут надо понимать, что в начале ХХ века у большинства татар фамилий не было.
Если взять топ-10 фамилий по областям в порядке убывания, то получается примерно так:
В Татарстане суммарно Закиров плюс Шакиров (похоже, корень фамилии-то один, просто написание разошлось когда-то) очень сильно опережают по распространенности фамилию Иванов.
простите, корни у фамилий Закиров и Шакиров совсем разные. Это в русском языке разница в данном случае в одной букве создаёт ощущение чего-то похожего.
Но фамилии эти образованы по "русскому" принципу от отчества, а исходными именами были Закир и Шакир (причём, не знаю, как в татарском языке, в оригинальном арабском там ударение на первые слоги). Первое имя обозначает человека, который произносит молитву Всевышнему (поминает, исходный глагол - вспоминать). Второе имя обозначает человека, который благодарит всевышнего (исходный глагол - благодарить). Если Вы когда-то слышали, как по-арабски будет "спасибо"... так, вот, это однокоренное слово.
Извининте за умничество.. но, вдруг, это будет интересно Вам или кому-нибудь ещё... Важно понимать в итоге, что фамилии эти произошли от имён, и эти имена - разные. Фамилии Хасанов, Сафин, Валеев, Галимов - тоже от имён.
Спасибо за разъяснение - я этого не знал и это очень интересно. Кстати, отыменные фамилии характерны и для части рядом прилегающих областей (но там образование фамилии шло от русских имён)!
И ещё важно понимать в итоге, что в начале ХХ века даже то, что называлось "фамилиями" у татар, - были всё же отчества. То есть дети Шакира Закирова в советские паспорта были записаны скорее всего Шакировыми, а не Закировыми.
Вполне возможно. Но такие фамилии могли возникнуть и в 19 веке. Я не знаю этого точно. Нужно иметь примеры исследований татарских родов.
Примеры есть. Но точности они не прибавляют: новые татарские фамилии возникали и в 19-м веке, и в 20-м, влоть до 1920-х годов точно, а может и позднее.
Добрый день! На основании анализа каких данных составлена Ваша карта?
Я на примере одного Фаленского района проводил такой анализ по данным списков домовладельцев 1891 г.
Результаты выложил здесь: http://www.falenki.ru/story/samye-rasprostranennye-familii
От Ваших они отличаются.
В качестве источника были использованы данные ОБД Мемориал. В этом плане, в отличие от списков домовладельцев (учета количества дворов), картина может более приближена к реальности по численности населения. Конечно же, это не "истина в последней инстанции" - просто очередной анализ.
Обработка данных проводилась с использованием пакета Microsoft R Open, картография выполнена с использованием QGIS.
По Фаленскому району топ-10 получился такой:
Да, картина отличается - например, Лекомцевы вместе с фамилиями Возжаев и Чирков - лишь на 23-25 местах. Однако, для районов столь дальний анализ мне кажется пока не особо оправдан - едва ли надо далее топ-5 смотреть. Либо надо использовать иные способы анализа - например, для сравнения списков использовать коэффициент ранговой корреляции Спирмена.
Недавно мы обсуждали погрешности ОБД Мемориал: https://rodnaya-vyatka.ru/blog/2785/116857
Конкретно в данном случае в чем они могут выражаться. Почему, например, в Вашем списке Катаевы не на 1 месте, как в моем по данным на 1891 г. Учитывая большое количество орфографических ошибок в фамилиях на ОБД, следовало пробить так же и фамилию КОтаев и т.п.
Топ первых фамилий 1891 г. по Фаленскому району выглядит так:
Катаевы-176
Лекомцевы-146
Злобины-143
Лысковы-141
Ушаковы-138
Шуклины-133
Зорины-118
Корепановы-116
Костицыны-108
Мильчаковы-102
Городиловы-101
Яговкины-98
Мусихины-96
Нелюбины-96
Кропотины-95
Жвакины-93
Кропачевы-92
Микрюковы-92
Смольниковы-91
Широковы-84
Никулины-82
Веселковы-77...
Для сравнения возьмем еще данные Книги Памяти КО том 13 (Фаленский район).
Пересчитал некоторые из указанных фамилий. Получается примерно так:
Катаевы - 106 погибших
Ушаковы - 96
Лысковы-83
Злобины-79
Лекомцевы - 72
Корепановы - 67
Яговкины-62
Широковы - 52
Как видите, в Книге Памяти лидируют те же Катаевы, Лысковы, Лекомцевы, Злобины, Ушаковы. Как и в 1891 г.
Книге Памяти я больше доверяю, т.к. помню, как их составляли. Данные собирали на местах по сельсоветам, по каждой деревне.
Да, и еще забыл добавить, что на ОБД Мемориал старое административное деление по районам. В число Катаевых (Лекомцевых, Лысковых...) в моих списках еще включены Катаевы (Лекомцевы, Лысковы) Бельского района, который в 1956 г. был полностью включен в состав Фаленского района.
Разумеется, я использовал старое административное деление - за основу были взяты данные 1939 года и были учтены основные поправки, происходившие до 1945 года.
Гм...., но если работа сделана по данным ОБД "Мемориал" - какое же это "начало ХХ века"! Это 1940-е годы ХХ века, т.е. середина, а не начало. Ведь то, что эти люди были 1900-1920-х гг. рождения вовсе не означает, что в эти годы они имели эти же фамилии! Вы понимаете, что целые категории фамилий (еврейские, например) в 1900-е годы были совсем не такими, как в 1940-е? Ну, грубо говоря, что Троцкие были Бронштейнами, а Сахаровы - Цукерманами? Про татарские фамилии я уже подробно написал выше.
Если учитавать оба района (по-старому): Фаленский + Бельский, то получается топ-10 такой:
Примечение: если суммировать Катаев + Котаев, то картина кардинально не меняется.
У меня по-другому получается. Я ввожу на ОБД Мемориал в расширенный поиск "Катаев Фаленский" - найдено 110, ввожу "Катаев Бельский" - 167 найдено. Итого - 297 + 33 Котаевых. Всего 330.
Яговкины - 103+28, получается всего лишь 131.
Ушаковых, действительно больше, - 169+198=367. Но, т.о. получается, что один и тот же погибший подстчитан 3-4 раза (по данным донесений о безвозвратных потерях, по данным Книг Памяти, по спискам захоронений и т.д.).
Как интересно отличаются данные. Я сейчас зашел на ОБД Мемориал. В расширенном поиске задавал фамилию и место рождения. Если выделять ВСЕ типы основных документов, то получилось:
Катаев Фаленский - 80
Катаев Бельский - 114
Яговкин Фаленский - 88
Яговскин Бельский - 24
Ушаков Фаленский - 132
Ушако Бельский - 62
В любом случае - странно, что цифры сегодня-то отличаются :)
Реально я собирал данные достаточно давно. Разумеется, по ним видно, что один и тот же человек часто учтен несколько раз.
Поэтому данные были отфильтрованы следующим образом (я там сегодня частично уже писал - ниже пост): удалены дубликаты с полным совпадением ФИО + год рождения. Конечно же, удалены записи без года рождения (иначе я не смогу определить, что для него есть дубликат).
Конечно же, не все типы документов были учтены. Так, Книги Памяти в частности не были учтены - например, при поиске Ушаков и Кировская (обл.) они выдают только 2 Ушаковых. Во многих других типах документов данные также не содержат нужной информации.
Спасибо за ссылку на обсуждение - я его пропустил и сейчас почитаю.
Немного не по теме, интересней техническая сторона вопроса, как именно собирались данные (скрипты?), критерии отбора данных (какие поля собирались?). Если я правильно понял за основы сбора данных брался РВК призыва или район рождения, что произошло с исключениями? (например Бемыжский район, которого с 1956 года нет). Если есть время/возможность желательно подробней (доступно для чайника).
Немного о технической стороне - как я писал выше, использовался продукт Microsoft R Open, все скрипты писались вручную - часть из них сохранил, а часть нет смысла сохранять, так как способов матобработки очень много и удлось посмотреть огромное количество различных характеристик. Язык программирования R удобен для манипуляций с текстовыми данными и для работы со статистикой - этим и объясняется его выбор. Сбор данных непосредственно из ОБД Мемориал занял около 2 недель - срипт анализа работал с интервалами, чтобы случайно не нагрузить сервер.
В качестве места использовалось, разумеется, место рождения. Для этого был оцифрован и вручную сверен справочник по административному делению СССР за 1939 год плюс были внесены некоторые правки из более поздних изменений за годы Войны (так, некоторые районы меняли название и чтобы не утратить данные, они были объединены).
В процессе обработки были отфильтрованы фамилии, встречающиеся крайне редко внутри района (чаще всего это результаты опечаток), и, увы, пришлось отфильтровать данные о женщинах-воинах, чтобы получить картину только по мужскому населению как основному инструменту передачи фамилий. Кроме того, были удалены дубликаты по ФИО и году рождения внутри каждого района - это позволило очистить данные от дублирующих записей.
Как я писал выше, использовалось старое административное деление. В качестве координат района брались координаты его районного центра по его местоположению в то время. Соответственно, хотя сейчас Бемыжского района нет, но в полученных данных он есть и точка на карте для него есть.
Сделаю еще общий комментарий о достоверности данных.
Сравнение полученных результатов с известными публикациями о численности фамилий показывает хорошую корреляцию. Так, коэффициент корреляции со списком Журавлева [Журавлев А.Ф. К статистике русских фамилий. I / Вопросы ономастики, №2, 2005. - с. 126-146.] составляет 0,92. Неплохая корреляция и с другими исследованиями (сравнивалось также со списками Унбегауна, Балановских, Никонова).
По результатам тестов на общую картину не влияют случаи отсутствия фамилии (по понятной причине), а также вобщем-то, немногочисленные случаи смены фамилии.
Кстати наиболее распространённые фамилии совпадают со списком фамилий, которыми интересуются пользователи на сайте:
https://rodnaya-vyatka.ru/families