Обзор возможностей утилиты для работы со списками «ДНК-совпаденцев» в российском сервисе «Генотек»

Обзор возможностей утилиты для работы со списками «ДНК-совпаденцев» в российском сервисе «Генотек»

Автор –  Рустам Усманов (распространяется бесплатно здесь)

           В первичной нашей публикации «О чем могут поведать гены», связанной с личным опытом ДНК-тестирования, мы поделились впечатлениями, некоторой аналитикой и возможностями по поиску родственников через популярные российские и иностранные сервисы, а также о том, каким образом полученные данные можно интерпретировать и использовать в своей работе. По мере поступления информации статья продолжает корректироваться и дополняться, являясь своего рода персональным помощником и справочником. Авторские впечатления вызвали интерес и обсуждения, благодаря которым многим из нас удалось подтянуть кругозор, за что и выражаем благодарность всем откликнувшимся. Мы в очередной раз убедились, насколько ДНК-тестирование является привлекательным и перспективным. Вполне логичным оказался факт того, что весь актив Родной Вятки – админы и модераторы проекта в большинстве уже оказались глубоко в теме или в ходе обсуждений оперативно подключились к работе, пройдя такое тестирование и получив интересный опыт. Как это в будущем отразится на проекте – покажет лишь время.

Для тех, кто еще только подумывает о такой возможности, поделимся альтернативной ссылкой на статью нашего коллеги, предназначенную для сомневающихся и для новичков: - «Поиск живых родственников и информации о дальних предках через тест ДНК. Часть 1 - Как ДНК может помочь узнать предков?». Материал изложен доходчиво, поэтому рекомендуем ознакомиться и сделать персональные выводы об актуальности ДНК-тестирования в ваших семьях.

Мы ориентируемся на возможности российского сервиса «Генотек», как более понятного российскому капризному потребителю (а мы очень капризны). «Хотелок» и пожеланий к сервису у нас очень много, надеемся, что со временем большинство из наших чаяний найдет свое воплощение в функциональных возможностях российской компании. В пользу «Генотек» следует отнести факт стремительно наращиваемой клиентской базы. Точное число клиентов «Генотек», конечно же, неизвестно, это значение не является публичной информацией, однако используя некоторые аналитические возможности, можно определить, что по состоянию на начало сентября 2022 года число клиентов «Генотек» составляло величину не менее 340 тыс. человек. Процесс динамичен, еженедельно число подгружаемых в систему тестов увеличивается. Для автора число выявленных только за 2 последних месяца новых «совпаденцев» составило величину 110 человек, т.е. почти 1/7 от первоначально выявленного их количества. Интересно было бы узнать о впечатлениях первой сотни протестировавшихся в «Генотек» лиц и как ДНК-тестирование повлияло на их жизнь. Насколько нам известно, в первую 20-ку таковых людей когда-то вошли персоны, чьи фотографии мы имеем возможность наблюдать на обложках журнала «Forbes».

Обширная клиентская база «Генотек» приводит к следующим приятным последствиям: список выявленных «совпаденцев» (вероятных родственников) значителен и постоянно растет. Если очень не повезло – то количество обнаруженных вероятных родственников составит величину около 360 человек, ну а тем, кому повезло – величина может составить от 2.5 до 3.5 тыс. человек. Если для выявленных 360 человек фильтрация списка «совпаденцев» в ручном режиме особого труда не составляет, то при более высоких значениях выявленных «совпаденцев» существует риск сломать мозг, разбираясь в полученных результатах. «Генотек» в данном направлении пока занимает выжидательную позицию, возлагая задачу спасения утопающих на самих утопающих. Возможно, что в «Генотек» такие инструменты уже имеются, либо они дорабатываются для коммерческих целей.

К счастью, в России не перевелись еще умельцы, пытающиеся на коленках создавать вспомогательные инструменты для анализа «совпаденцев». Об утилите такого левши мне и хотелось бы рассказать. В зависимости от пожеланий автора и обращающихся к нему лично заинтересованных лиц, программное средство периодически модифицируется и совершенствуется. Идея составить обзор о результатах работы с данной утилитой давно назрела и настоящая статья родилась под впечатлением от результатов её испытания. Для особо продвинутых пользователей, не желающих тратить время на изучение подробной инструкции по использованию утилиты, вполне достаточно перейти к предпоследнему абзацу в настоящей статье, в котором кратко и изложены возможности программы.

Утилита от Рустама Усманова позволяет осуществить экспорт сведений о родственниках из личного кабинета «Генотек» в автономный документ с возможностью сортировки и фильтрации среди «совпаденцев». Это основные возможности утилиты, которыми мы пользуемся. В качестве дополнительной возможности, предусмотрен экспорт генеалогического древа в формате XML для работы в Gramps 1.7.1. (т.е. для работы с древом потребуется скачать и установить бесплатную программу и работать с экспортированным древом в этой программе). Ранее клиенты «Генотек» жаловались на невозможность загрузки в сервис готового древа из сторонних сервисов, но проблема в октябре 2022 г. была  оперативно решена. «Генотек» радует новых пользователей появившимся функционалом:

    

Если у вас уже есть древо в "Генотек", то для загрузки в систему "внешнего" древа "извне" старое древо потребуется удалить, и иногда это проще осуществить через обращение в техподдержку компании.

Возможность обратного процесса на сегодняшний день обеспечена лишь за счет программного средства Рустама. При помощи Gramps данные из экспортированного древа можно импортировать и экспортировать в иные форматы. Т.е. у нас фактически имеется универсальный инструмент, благодаря которому труды по составлению древа в «Генотек» возможно использовать в сторонних сервисах.

Что нужно для того, чтобы осуществить экспорт данных о «совпаденцах»? Ответ: современный браузер с поддержкой JavaScript (автор использует в качестве такого браузера - Google Chrome) и система управления пользовательскими скриптами, например, Tampermonkey. Скачать и установить систему управления скриптами можно здесь. Браузер Google Chrome можно установить с официального сайта. Установка и того и другого примитивна, начать работу мы рекомендуем с установки интернет-браузера.

Установка утилиты Рустама Усманова осуществляется непосредственно по ссылке. Нажатие на ссылку и выбор варианта "ОТКРЫТЬ" приводит к автоматической установке на компьютере особого скрипта. После этого вы всегда готовы к дальнейшей работе в выбранном вами браузере. Акцентируем ваше внимание, что устанавливать скрипт нужно из браузера, в котором вы будете работать с утилитой, в нашем случае - из браузера Google Chrome. Попытка установить скрипт из иного интернет-браузера приведет к появлению ошибки со следующим системным сообщением:

Как использовать утилиту: В личном кабинете «Генотек» в разделе Поиск родственников в панели фильтров после установки утилиты появится ссылка/кнопка на документ с экспортируемыми сведениями. На рисунке кнопка обведена квадратом.

При нажатии на ссылку/кнопку проиcходит загрузка документа в формате HTML. Загруженный документ и является списком ваших «совпаденцев». Название файла присваивается автоматически и имеет следующий вид: «ung(хх).html», где хх – номер последнего скачанного на компьютер списка «совпаденцев», присвоенный браузером при его загрузке. При первичной загрузке списка файл будет носить название «ung.html».

Если вы еще не обменивались ссылками на профили в «Генотек» с коллегами, осуществившими ДНК-тестирование - непременно это сделайте. Это позволит вам использовать все дополнительные возможности установленной утилиты. Не все понимают, как это сделать, поэтому объясняем: в личном кабинете «Генотек» в правом верхнем углу нажимаем на значок пользовательского меню (в нашем случае он выглядит как буква «Е» в кружочке, сокращение от «Елена»). При нажатии на кнопку «копировать ссылку» указатель на ваш профиль копируется в буфер обмена. Поделитесь им с вашими друзьями любым удобным способом. Ссылка активна не более суток.

Если вам прислали такую ссылку, откройте её и вы попадете на страницу авторизации в личный кабинет «Генотек». Авторизуйтесь. Откроется ваш кабинет, который в это время будет слабо реагировать на ваши «клики», слегка «зависая». Не пугайтесь, система в это время прописывает для вас новые возможности. Если вы сразу начнете искать изменения, произошедшие в интерфейсе, то вы их не обнаружите. В системе используется не очевидный механизм добавления «друзей». Ничего страшного, вы быстро привыкнете. Для того, чтобы обнаружить произошедшие в кабинете изменения потребуется обновить веб-страничку в браузере (например, нажав на F5 или заново авторизоваться в профиле). После обновления в личном кабинете появится новый, добавленный и нужный вам пользователь. Выглядеть это будет примерно так, как показано на скриншотах ниже. Выбираете нужного вам пользователя и осуществляете в режиме просмотра изучение данных о происхождении, а также о древе или о здоровье поделившегося с вами ссылкой коллеги. Объем возможных для просмотра сведений ограничен пользовательскими настройками безопасности профиля поделившегося, а также доступным для него в «Генотек» функционалом. Если коллега прошел только тест на происхождение, то возможности просмотра данных о его здоровье вам будут изначально недоступны. Технически личный кабинет коллеги будет выглядеть для вас также, как свой собственный кабинет. В разделе Поиск родственников сбоку будет присутствовать заветная кнопка, запускающая работу утилиты Рустама. Нажимая на нее, вы можете скачать на компьютер список «совпаденцев» для вашего друга/коллеги/родственника. Аналогичную операцию вы можете осуществить по отношению ко всем вашим друзьям.

  

 

Обратим внимание на то, что в друзьях можно находиться не 24 часа (как можно подумать), а сколь угодно долго, пока человек, решивший прекратить с вами «дружить» не удалит вас из списка своих друзей, лишив вас возможности просматривать своих «совпаденцев» и древо.

Скачав документ и открыв его в браузере, вы получите доступный для дальнейшей работы документ. Открывайте его в том же браузере, в котором скачали файл.

Общий вид документа выглядит примерно следующим образом:

Акцентируем внимание на том, что скачанные файлы "совпаденцев" вида "ung.(xxx)" рекомендуется открывать не  из проводника, как многие инстинктивно пытаются сделать (хотя это и возможно), а из самого браузера, в пределах одной сессии (т.е. осуществив последовательно загрузку файлов "совпаденцев", не закрывая Google). Только в этом случае вы увидите заветные "галочки" вверху над шапкой таблицы. Если для программистов такой алгоритм очевиден, то для людей, не понимающих, как работают скрипты, результат будет отличаться от ожидаемого. 😉

В скачанных документах возможна сортировка по ссылкам в шапке таблицы. Доступные поля для сортировки: Имя, возраст, пол, сумма общих сегментов ДНК, степень общности генома, максимальный сегмент ДНК среди общих хромосом, гаплогруппы по мужской и женской линиям и дата обнаружения «совпаденца» для данной персоны.

Анализируя список с датами, можно сделать вывод о том, что поток клиентов в «Генотек» внушительный, каждые 2-3 дня в системе выявляются очередные «совпаденцы».

Обратим внимание на «галочки» над шапкой таблицы и на список указанных над таблицей персон: это и есть ваши друзья/родственники, поделившиеся с вами ссылками на свои профили, чьи данные вы скачали на компьютер. Поставив «галочку» напротив соответствующей персоны, вы получите коротенький список ваших общих «совпаденцев». Это и есть та самая «вундервафля» утилиты - ФИЛЬТРАЦИЯ. Именно это мы все и желаем видеть в официальных возможностях «Генотек». Интересно, что общие «совпаденцы» между двумя любыми персонами обнаруживаются всегда. Среди полезностей утилиты имеется возможность поставить «галочки» для фильтрации сразу в отношении нескольких персон, отфильтровав таким образом общих между ними «совпаденцев». Для реальных, известных родственников 4-й и 5-й степеней родства такие лица всегда обнаруживаются и являются первыми кандидатами для дальнейшей работы.

Таким образом, максимально эффективный алгоритм поиска среди "совпаденцев" настоящих, а не ложноположительных родственников, заключается в следующем:

1. "Подружиться" с верифицированными родственниками, прошедшими ДНК-тестирование.

2. Выявить с помощью утилиты общих с вами  "совпаденцев".

3. В приоритете собственных исследований акцентировать свое внимание именно на общих "совпаденцах".

4. Повторить цикл уже для них, постепенно расширяя круг поисков.

Именно эти "круги" и будут являться стержневым направлением для дальнейших поисков, имеющих перспективу. В случае географической удаленности  предков друг от друга, "круги" будут иметь разные направления распространения, которые можно в дальнейшем обрабатывать интуитивно или через математический анализ.

При наличии у пользователя некоторых навыков программирования, утилита без проблем модернизируется под конкретные нужды потребителя.

Прямая практическая польза от такой фильтрации связана со случаями, когда невозможно разделить всех  "совпаденцев" на маминых, папиных или иных, ввиду невозможности их протестировать. Родственники рано или поздно уходят из жизни, к сожалению. Для моих 1236-ти "совпаденцев (по состоянию на 01.01.2023), в отсутствие живых родителей, всех бабушек и дедушек, оказалось возможным соотнести часть совпаденцев по линии бабушки, через неполнородную тетушку (ее дочь от ее первого брака). Количество соотнесенных "совпаденцев" составило 1/6 часть от общего их числа - 209 человек. Через троюродного деда по материнской линии удалось соотнести еще 57 "совпаденцев", через пятиюродного деда получилось соотнести еще 22 человека.  Еще в паре случаев: для моей дальней родственницы, неопределямой средствами "Генотек", оказалось возможным соотнести 18 человек (Наталья К.) и для другой, прекрасно обнаруживаемой средствами "Генотек" и "Gedmatch" - 21 человек (Наталья Г.). Тесты ДНК для неполнородных родственников наиболее "говорящие" при использовании такого инструмента. Любой тест родственника с дальней степенью родства способен приоткрыть историю рода с неожиданной стороны.

Еще одним ярким примером, являющимся дальнейшим продолжением темы фильтрации, является тест родной сестры моего деда. На момент проверки (28.01.2023) число моих совпаденцев уже было 1274 человека. У родной сестры деда - число совпаденцев - 1782. Общие между нами нами - 208 человек. Формально все 1782  ее совпаденцев - мои тоже, но общего генома меж нами только 12,28%, т.е. 1/8. "Совпаденцев" именно столько - почти 1/8 от ее общего количества, или 1/6 от моих. Т.е. без дедушек, бабушек и без родителей - потери в поиске составляют огромную величину... Вывод: старшую родню тестировать надо непременно. 😊 Один старший родственник соотносит  примерно 1/6 часть "совпаденцев". Три старших родственника двоюродной степени родства по разным веткам -  соотносят до половины от всех "совпаденцев".

В заключение приведу цитату из памятки-описания к работе утилиты от её автора, которая в нескольких строчках максимально лаконично трактует её возможности:

«После открытия документа появляются возможности сортировки по ссылкам в шапке таблицы и фильтрации общих для нескольких профилей родственников. Фильтрация общих с каким-либо профилем родственников возможна при предварительном посещении раздела Поиск родственников в этом профиле. При просмотре собственного генеалогического древа, либо древа родственника в заголовке окна появится ссылка на документ с экспортируемыми сведениями».

Остается лишь горячо поблагодарить автора за предоставленную нам возможность анализа списков «совпаденцев», значительно облегчающую поисковые мероприятия. Надеемся, что автор в будущем порадует нас дополнительным функционалом.

Комментарии

Для подавляющего большинства форумчан это сложно, непонятно и наверное ненужно. У Генотека при просмотре "родственников" есть и настраиваемые фильтры, и сортировка, и возможность сразу связаться с любым совпаденцем.

Что не отрицает полезности данной утилиты для тех, кто понимает)

Аватар пользователя Сильвер

Когда я несколько лет назад впервые забрел на  Родную Вятку, то не понимал ничего из того,  что здесь  публикуется, кроме стихов и поэтических этюдов, выложенных в блогах и форумах.  Сайт показался мне очень подозрительным. Прошли годы, я научился  читать старинные документы и при слове "сказка" перестал  вспоминать бабу Ягу и Кощея Бессмертного. Мы все потихоньку учимся и повышаем свой образовательный уровень, но каждый по-разному. Новое не сразу воспринимается, все что непонятно, то подозрительно 😉 Все, что связано с ДНК- тестированием, у обычного человека "не в теме" вызывает подобную реакцию (это нормально). Эта и подобная ей статьи - кирпичики и одновременно юзерпики, цель которых - уменьшить зашкаливающий уровень  недоверчивости до здорового уровня. Не все сразу. Но худшее, что может быть - это равнодушие. Пользователи Родной Вятки отличаются,  с одной стороны неравнодушием, а с другой стороны - скептицизмом. Ну и по теме: от возможностей фильтрации в Генотек мы грустим.  Они есть, но их мало. 🙄 Сразу связаться с нужным пользователем тоже возможно, вопрос только в том, захочет ли он отвечать. 😉  Но разве нас, сумевших по документам раскопать своих предков до 1600х, такие мелочи остановят? 😄

По личному опыту не рекомендовал бы воспринимать информацию о возрасте общего предка по мужской линии как научно доказанный факт, что не умаляет очевидных успехов компании.

там вроде счёт на тысячелетия идёт, если тест наY от Генотек)

Аватар пользователя Сильвер

Генотек продвинутый игрек-тест пока делать не планирует (информация от официального представителя компании в официальном телеграмм-канале Генотек). В связи с этим, об общих предках по мужской линии можно узнать лишь в пределах аутосомного теста, способного заглянуть лет на 300 назад (иногда чуть больше). Ну и информация о личной гаплогруппе по мужской/женской линиям и возрасте ее появления, сообщаемая компанией клиентам - это общедоступные научные данные.

аутососный тест не показывает родство по прямой мужской линии

Аватар пользователя Сильвер

Это будет одной из тем моей будущей публикации, где-нибудь в октябре-ноябре 2022го. Сравнение аутосомных тестов по прямой линии отца и сына. Вятских потомков. То бишь меня с киндером. Прямее и ближе мужской линии для сына нет (как я пока полагаю). 😉 интересно будет посмотреть на распределение этносов (все-же мама с самой юной, 4й группой крови, времен крещения Руси), да вятские карело/финны интересно, как сынуле экспортировались. Так что в ожидании.

понятно, что у родного сына будет +/-50% аутосом отца, но уже у деда их м.б. менее 10% а у прадеда и вовсе не сыщется; т.е. с помощью лишь аутосомного теста невозможно доказать, что этот дед по прямой мужской линии, не говоря о более дальних прямых по М. линии

Аватар пользователя Сильвер

Может быть "да", а может быть и "нет". Теория говорит, что от деда может прийти до 25% геномного набора (в пределе). От прадеда 12,5% (в пределе), от прапрадеда 6,25% (в пределе), от 3прадеда - 3.12%. У четвероюродных совпаденцев нередок процент общности генома в районе 1%. Если кто-нибудь выложит хорошую презентацию о степени передачи аутосом от деда к внуку, на КОНКРЕТНОМ примере, с картинками общих участков, то очень бы нас порадовал. Пока я таких наглядных демонстраций не видел, интересуют тесты, сделанные в пределах одного сервиса и по одним алгоритмам интерпретированные. Если вам знакомы такие публикации - поделитесь. 😉

теоретически внук может получить от 0 до 50% аутосом своего дедушки, есть реальные случаи, когда 10%.

но речь первоначально велась совсем нн об этом, а о прямой м. линии...

Аватар пользователя Сильвер

Я бы эти 10% отнес бы к несовершенству алгоритмов, не научившихся обсчитывать общие куски геномов менее 8 сМ, а также различиями в тестировании разных сервисов. Если уж делать, то делать и сравнивать в одном сервисе, по единым алгоритмам. Очень легко потерять при попустительском отношении анализатора процентов до 5-7 общности. Прямую мужскую линию с игрек-тестами я в расчет не беру... там лет на 500-600, как минимум, все как у овечек Долли. Вам, скорее всего было бы интересно разобраться и с дремучими Х- совпаденцами. У меня такой есть, повезло на обоюдную богатую проработку древа, представление о том, что Икс-совпаденцы могут восходить к общим корням времен Ландрата появилось. Жаль, что это не Вятка, было бы проще. Но пока без выводов. Ошибиться так легко...

Компания Генотек. Дед и внук. Мужская линия. Предки - с. Пьяный бор.

Аватар пользователя Сильвер

Спасибо, Дмитрий. Это лучше всяких слов демонстрирует совпадение между внуком и дедом по днк в идеальном исполнении. 24,45%. Просто классика! Мне попадались значения в диапазоне 23-24%, не ниже, поэтому 10% у кого-то там изначально меня заинтересовало своей маловероятностью. Примерно как 7 радуг одновременно над рекой, следом друг за другом.😉

Аватар пользователя Виктор_В

понятно, что у родного сына будет +/-50% аутосом отца, но уже у деда их м.б. менее 10% а у прадеда и вовсе не сыщется;

Есть статистика собранная командой Блейна Беттингера - https://dnapainter.com/tools/sharedcmv4
Они собрали 1106 отношений дед/внук, ни одного случая когда в этом отношении было меньше 984 сМ не обнаружено.
Для прадеда/правнука собрано 149 отношений, ни одного случая меньше 485 сМ не зафиксировано.

Ну да, вероятность такая существует. Также существует вероятность, что по дороге домой в меня попадет метеорит, но чугунный зонтик я носить не буду ))

Аватар пользователя Сильвер

Спасибо. Я табличку видел, но на количество лиц в выборке  не обратил внимание. Теперь понятнее. В Генотеке я не слышал о случаях родства между бабушками/дедушками - внуками с коэффициентом родства 10 процентов. Всегда больше. Более правдоподобна ситуация, для 10% родства связана с генетическим дедом на ступеньку далее от документированного. Например: фактическим отцом ребенка был брат или отец деда. Для 10% это нормально. Правда в этом случае наружу никогда не вылезет, а потомки удивленно  будут вопрошать, почему родства с дедом так  мало. А он совсем не дед, а прадед, или брат его деда. 😉 Внезапно всплывший скелет, ставший поводом для претензий к сервис-системам.