13 26 15 11 12 11
то есть мутация прошла на единицу на повышение, 25 → 26. Последние две мутации, в гаплотипах под номерами 058 и 067, оказались двойными (25 → 23, 25 → 27):
13 23 15 11 12 11
13 27 15 11 12 11
Они и сидят по обе стороны "букета", потому что не происходят одна из другой. Заметьте, что длина "спицы" в двух последних случаях тоже двойная, по сравнению со всеми остальными. То есть по виду дерева гаплотипов можно сказать, какие мутации одиночные, какие – двойные или тройные.
Внешний вид "дерева" определяется настройками профессиональной компьютерной программы, которая строит его на основании вводимого списка гаплотипов. Она сортирует гаплотипы по ветвям, то есть по похожести гаплотипов, сортирует по тому, в каких маркерах произошли мутации, сколько мутаций произошло, и по тому, насколько ветви древние. Поэтому по виду дерева человек опытный сразу может понять, какова структура той или иной популяции, сколько в ней основных ветвей, каков относительный возраст ветвей, и далее по числу мутаций в ветвях рассчитать, когда жил общий предок каждой ветви. Таких компьютерных программ много, наиболее известная – PHYLIP, с преобразованием MEGA.
По виду базовых гаплотипов в разных регионах и по возрасту их ветвей можно устанавливать, откуда, куда и когда проходили древние миграции людей и где сейчас живут их потомки. То есть можно проводить ДНК-генеалогическое картирование регионов, материков, и всей планеты, как в пространстве, так и во времени. В этом – методология ДНК-генеалогии. А дальше идут интерпретации получаемых данных в терминах истории, языкознания, антропологии, стыковка их с известными данными (тогда это по сути "калибровка"), или с данными неустоявшимися, сомнительными, конфликтными – тогда это дополнительная "точка опоры", или, наконец, это введение в научный оборот совершенно новых данных, и открытие пути для их верификации, проверки, обсуждения, выдвижения новых гипотез и положений.
Следующие несколько вопросов с соответствующими ответами образуют своеобразный глоссарий, или словарь. Ряд понятий были уже рассмотрены ранее, но повторение – мать учения. Это вопросы-ответы помогут многим еще раз взвесить, насколько усвоен материал, и насколько могли быть пропущены некоторые детали.
Глава 3
Глоссарий ДНК-генеалогии
Вопрос 42: Что такое ДНК и что такое Y-хромосома?
ДНК, дезоксирибонуклеиновая кислота, сохраняет и реализует генетическую программу развития и функционирования организма человека. Находится в ядре клетки в составе 46 хромосом, одна из которых, самая маленькая по размеру – мужская половая хромосома, или Y-хромосома. В ней примерно 58 миллионов нуклеотидов, повторяющихся структурных единиц ДНК-аденина, гуанина, тимина и цитозина. Все 46 хромосом в совокупности состоят из трёх миллиардов нуклеотидов, и в их составе примерно 30 тысяч генов, в среднем по 652 гена на хромосому. В Y-хромосоме всего 27 генов, остальная часть – некодирующая, "никчёмная", как её часто называют, или, скорее, называли еще недавно. В ней находится много повторов нуклеотидных цепочек, часть которых генетики выбрали в качестве гаплотипов для ДНК-генеалогии. Копирование, или репликацию ДНК выполняет ДНК-зависимая ДНК-полимераза (в составе большого комплекса, реплисомы), которая иногда допускает ошибки, называемые мутациями.
Вопрос 43: Что такое маркер в ДНК-генеалогии?
МАРКЕР, или локус, сегмент, участок Y-хромосомы (в контексте данной книги), выбранный для определения числа повторов нуклеотидов для целей ДНК-генеалогии. Число повторов нуклеотидов в локусе называют "аллель". Маркеры нумеруют и присваивают им индексы, например, DYS19, то есть "DNA Y Segment, локус номер 19". В этом конкретном локусе повторяется четвёрка (квадруплет) ТАГА, то есть тимин-аденин-гуанин-аденин, причём повторяется у разных людей от 11 до 19 раз подряд. Эти границы чисто эмпирические. Возможно, у кого-то среди людей Земли он повторился 10 или 20 раз подряд, но вероятность такого события крайне мала. Число повторов – индивидуальная характеристика человека, и при увеличении числа маркеров совокупность аллелей становится всё более индивидуальной. В ранних академических исследованиях типировали (то есть определяли последовательности) от 5 до 9 маркеров, в современных – от 10 до 17, реже до 23 маркеров, в коммерческих работах обычно типируют от 12 до 111 маркеров, и выше – в специальных геномных исследованиях (стандартные варианты – 12, 17, 25, 37, 67 и 111 маркеров). Ниже приведен пример гаплотипа автора данной книги, в котором типировали 431 маркеров:
13 24 16 11 11 15 12 12 10 13 11 30 16 9 10 11 11 24 14 20 34 15 15 16
16 11 11 19 23 15 16 17 21 36 41 12 11 11 9 17 17 8 11 10 8 10 10 12 22
22 15 10 12 12 13 8 15 23 21 12 13 11 13 11 11 12 13 31 15 9 15 12 25
27 19 12 12 12 12 10 9 12 11 10 11 12 30 12 14 25 13 9 10 18 15 20 12
24 15 12 15 24 12 23 19 11 15 17 9 11 11 10 12 15 15 10 10 8 8 9 13 7 8
10 10 13 14 14 15 31 32 11 10 9 9 8 24 8 8 8 16 22 22 24 21 23 14 16
25 28 15 15 6 11 14 15 8 14 11 12 10 11 10 10 11 11 18 10 12 10 7 10 5
8 9 5 5 11 15 8 29 6 7 10 13 11 6 7 7 7 16 10 11 16 22 23 11 12 12 10 7
12 12 13 7 3 20 18 11 11 8 9 13 13 10 11 22 12 16 13 14 11 11 12 10 12
9 13 9 12 11 12 16 7 14 12 10 9 10 4 7 7 13 13 12 11 9 11 10 11 14 8 4 8
6 11 11 16 9 11 13 19 12 12 9 10 9 9 11 11 9 9 14 14 15 9 7 10 12 14 13
14 14 12 6 32 10 11 16 8 7 17 17 11 11 6 13 12 13 11 10 7 13 12 7 12 12
7 14 17 17 11 25 8 8 12 8 8 1113 11 12 10 8 13 8 13 14 10 11 9 20 17 15
36 9 13 14 39 33 36 9 10 10 12 18 19 13 9 14 44 10 8 14 9 8 20 11 11
11 11 10 9 9 9 8 8 8 8 9 11 9 23 11 9 16 31 8 20 8 13 12 8 16 10 9 33
27 23 22 10 8 12 10 8 14 8 8 32 55 7 7 5 9 6 11 11 11 13 9 39 33 7 8
27 7 5 13 7 15 28 25 60 42 12 31 22 20 12 3 4
Таких гаплотипов в мире определено пока всего несколько десятков, так что практическая польза от них пока невелика, за исключением нескольких специальных случаев, которые будут пояснены ниже.
Вопрос 44: Что такое аллель в ДНК-генеалогии?
АЛЛЕЛЬ, число тандемных повторов определенных блоков нуклеотидов в маркерах. Обычно в биологии понятие аллели относят к разным формам генов, расположенных в одинаковых маркерах хромосом одного типа, то есть гомологичных хромосом, и которые (аллели) при кодировании приводят к появлению различных вариантов одного и того же признака. В ДНК-генеалогии аллели задают разное число тандемных повторов в одном и том же маркере. Выше был приведен пример, когда в маркере DYS19 число повторов квадруплета ТАГА (TAGA) может быть от 11 до 19 раз. Числа аллелей в маркерах – важнейшая характеристика в ДНК-генеалогии, поскольку статистическое отклонение числа аллелей от предкового в каждом маркере гаплотипа позволяет рассчитывать, когда жили общие предки популяций, и эти расчеты работают на временах от сотен лет до нескольких миллионов лет.
Вопрос 45: Что такое гаплотип в ДНК-генеалогии?
ГАПЛОТИП – это совокупность аллелей, то есть наборов повторов в маркерах. Гаплотип записывается в виде набора чисел, которые отражают число аллелей в каждом маркере. Например, предковый гаплотип славян гаплогруппы R1a Русской равнины: в 12-маркерном формате (формате FTDNA)
13 25 16 11 11 14 12 12 10 13 11 30
в 25-маркерном формате
13 25 16 11 11 14 12 12 10 13 11 30–15 9 10 11 11 24 14 20 32 12 15
15 16
(здесь поставлено тире между первой и второй панелью маркеров, точнее – аллелей, потому что в длинных последовательностях чисел легко потеряться, а тире представляют собой метки, на которые можно ориентироваться),
в 37-маркерном формате
13 25 16 11 11 14 12 12 10 13 11 30–15 9 10 11 11 24 14 20 32 12 15
15 16–11 11 19 23 16 16 18 19 35 38 14 11
в 67-маркерном формате
13 25 16 11 11 14 12 12 10 13 11 30–15 9 10 11 11 24 14 20 32 12 15
15 16–11 11 19 23 16 16 18 19 35 38 14 11–11 8 17 17 8 12 10 8 11
10 12 22 22 15 10 12 12 13 8 14 23 21 12 12 11 13 11 11 12 13
в 111-маркерном формате
13 25 16 11 11 14 12 12 10 13 11 30–15 9 10 11 11 24 14 20 32 12 15
15 16–11 12 19 23 16 16 18 19 35 38 14 11–11 8 17 17 8 12 10 8 11
10 12 22 22 15 10 12 12 13 8 14 23 21 12 12 11 13 11 11 12 13–32 15
9 15 12 26 27 19 12 12 12 12 10 9 12 11 10 11 11 30 12 13 24 13 9 10
19 15 20 11 23 15 12 15 24 12 23 19 10 15 17 9 11 11
Вопрос 46: Что такое "стандартная запись гаплотипов в формате FTDNA"?
ФОРМАТ FTDNA – форма записи гаплотипов, принятая компанией Family Tree DNA (США), основной компанией в мире по тестированию ДНК, и далее принятая в ДНК-генеалогии. В статьях по популяционной генетике такая запись практически не используется, и по простой причине – протяженные гаплотипы там не используются. Порядок записи гаплотипов в попгенетике другой, и часто нестандартный, меняющийся у разных авторов. Но поскольку гаплотипы в попгенетике используются редко, то им такой разнобой не мешает.
Порядок маркеров в 12-, 25-, 37-, 67– и 111-маркерных гаплотипах следующий (в верхней строке – порядковый номер маркера, в нижней – индекс маркера DYS):