Денис Владимирович Соломатин - Математические модели в естественнонаучном образовании. Том II стр 11.

Книгу можно купить на ЛитРес.
Всего за 990 руб. Купить полную версию
Шрифт
Фон

г. Объясните, почему алгоритм FM также не построит правильное дерево.

5.3. Построение дерева дистанционным методом присоединения соседей

На практике метод UPGMA и FM-алгоритм редко используются для построения дерева, потому что существует дистанционный метод, который как правило работает лучше, чем любой из них. Тем не менее идеи, лежащие в их основе, помогают понять популярный алгоритм присоединения соседей, на котором сосредоточимся в дальнейшем. Чтобы понять, почему UPGMA или FM-алгоритм могут быть ошибочными, рассмотрим метрическое дерево с 4 таксонами на рисунке 5.15. Здесь  и  представляют определенные длины, причем  намного меньше, чем . Говорим, что вершины  и  в этом дереве являются соседями, потому что ребра, ведущие от них, соединяются в общей вершине. Точно так же  и  являются соседями, но  и   нет.



Рисунок 5.15. 4-таксонное метрическое дерево с дальними соседями, .

Предположим, что метрическое дерево на рисунке 5.15 описывает истинную филогению таксонов. Тогда идеальные данные дадут нам расстояния в таблице 5.10.

Таблица 5.10.  Расстояния между таксонами на рисунке 5.15











           3х           x+y         2х + y



                         2x+y      x+y



                                         x+2y

Но, если  намного больше  (на самом деле,  уже достаточно хорошо), то ближайшими таксонами по расстоянию являются  и , которые не являются соседями. Таким образом, UPGMA или FM-алгоритм, выбирая ближайшие таксоны, выбирает для присоединения не соседей. Самый первый шаг соединения будет неправильным, и как только присоединимся к не соседям, то не восстановим истинное дерево. Суть проблемы заключается в том, что если молекулярные часы не работают, как в случае с деревом на рисунке 5.15, то ближайшие таксоны по расстоянию не обязательно должны быть соседями по дереву.

Вопросы для самопроверки:

 Если  намного меньше , то откуда уверенность в том, что молекулярные часы не работают в эволюции, описанной деревом на рисунке 5.15?



Рисунок 5.16. Дерево с соседями  и .

Таким образом, выбор ближайших таксонов для присоединения ввел заблуждение; нужен более сложный критерий выбора таксонов для присоединения. Чтобы изобрести его, представьте себе дерево, в котором таксоны  и  являются соседями, соединенными в вершине , а  каким-то образом соединена с оставшимися таксонами , как показано на рисунке 5.16.

Если данные точно соответствуют этому метрическому дереву, то для каждого , дерево будет включать поддерево, подобное изображенному на рисунке 5.17.



Рисунок 5.17. Поддерево дерева на рисунке 5.16.

Но на этом рисунке видим, что , так как в сумму слева входят только длины четырех ребер, отходящих от листьев дерева, а в сумму справа все они и, кроме того, удвоенная длина центрального ребра. Это неравенство называется 4-точечным условием для соседей. Если  и  являются соседями, то неравенство верно для любых значений  из диапазона от 3 до .

Условие 4-точек лежит в основе метода присоединения соседей, но предстоит еще много работы, чтобы перевести его в простую для применения форму. Для фиксированного  существует  возможных значения  удовлетворяющих условию  при . Если просуммировать 4-точечные неравенства по этим , то получим следующее неравенство, содержащее сумму расстояний .

Чтобы упростить это неравенство, определим общее расстояние от таксона  до всех других таксонов как , где расстояние  в сумме интерпретируется как 0, естественным образом. Затем, добавление  к каждой стороне исходного неравенства позволяет записать его в более простой форме следующим незамысловатым образом .

Ваша оценка очень важна

0
Шрифт
Фон

Помогите Вашим друзьям узнать о библиотеке

Скачать книгу

Если нет возможности читать онлайн, скачайте книгу файлом для электронной книжки и читайте офлайн.

fb2.zip txt txt.zip rtf.zip a4.pdf a6.pdf mobi.prc epub ios.epub fb3