Прежде чем перейти непосредственно к рассмотрению различных подходов к оценке достоверности результатов генетического анализа родства, хотелось бы сделать несколько замечаний. Довольно часто приходится слышать следующее суждение: «Положительные выводы различных идентификационных исследований, таких как дактилоскопическая экспертиза, почерковедческой экспертиза, трасологические экспертизы (например, экспертиза следов орудий взлома) и т.д., формулируются в утвердительной форме. В случае дактилоскопической экспертизы, положительный вывод может звучать так: след, обнаруженный там-то оставлен указательным пальцем правой руки гражданина такого-то. Положительные выводы молекулярно-генетических исследований всегда формулируются в вероятностном виде, поэтому результаты таких исследований имеют меньшее доказательственное значение, чем результаты других, традиционных, идентификационных экспертиз». Приведенное суждение является глубоко ошибочным. Дело в том, что утвердительные заключения перечисленных выше экспертиз основываются на «внутреннем убеждении эксперта» в том, что выявленные в процессе исследования признаки являются, в своей совокупности, не групповыми (характерными для определенной группы объектов), а индивидуализирующими, то есть присутствующими у одного и только одного физического объекта и однозначно выделяющими его из ряда схожих объектов. Ни для одного из существующих в настоящее время видов идентификационных исследований не разработано научно-обоснованных критериев для отнесения выявленной совокупности признаков к разряду индивидуализирующих, а не групповых. В отсутствие таких критериев, любая совокупность признаков является групповой, а соответствующий положительный вывод – вероятностным. На сегодняшний день, формализованные подходы к выражению вероятностных выводов для таких экспертиз в числовом виде также не разработаны. Категоричные положительные выводы современных идентификационных криминалистических экспертиз по свой сути субъективны, а их использование является результатом общественного компромисса.
Другими словами, положительный вывод любой идентификационной экспертизы является вероятностным, но только молекулярно-генетический анализ в настоящее время может с высокой точностью оценить достоверность полученного результата. Таким образом, молекулярно-генетическая экспертиза не только имеет огромную точность, но и корректно её определяет, что делает данный вид экспертизы уникальным.
Как уже говорилось, суть установления родства молекулярно-генетическими методами состоит в поиске совпадающих аллелей в генотипах исследуемых лиц. Это обусловлено тем, что при различных степенях родства генотипы родственных лиц обладают одним из следующих свойств:
- Должны содержать совпадающие аллели во всех исследуемых локусах (например, в случае аутосомных локусов для родства типа ребенок-родитель);
- Вероятность наличия в генотипах совпадающих аллелей для родственников выше, чем для неродственных лиц (например, в случае аутосомных локусов и родства типа брат-сестра).
В случаях, когда устанавливается степень родства, для которой генотипы родственных лиц обладают вторым из указанных выше свойств, вероятностный характер получаемого вывода очевиден. Однако, и в первом случае наличие требуемых совпадений аллелей в генотипах по всем исследуемым локусам может быть обусловлено как истинным родством, так и случайным совпадением генетических признаков не родственных лиц и не является 100% доказательством родства. Поэтому, перед тем как сделать положительный вывод о родстве, всегда проводится вероятностная оценка его достоверности. Существуют различные подходы к расчету уровня достоверности. Все они основываются на законах популяционной генетики и данных о частоте встречаемости различных генетических признаков.
В данном разделе рассматриваются два основных метода оценки уровня достоверности положительного вывода о родстве. Следует отметить, что далее при проведении вероятностных расчетов, выводе формул и построении логических цепочек принимаются следующие допущения:
- Популяция находится в состоянии равновесия Харди-Вайнберга для аллелей всех исследуемых локусов;
- В популяции наблюдается равновесие по сцеплению между любыми двумя исследуемыми локусами;
- Все исследуемые локусы являются попарно независимыми.
Допущения 1 и 2 оказываются применимыми в большинстве случаев, так как справедливы для больших однородных популяций, в которых в течение большого количества поколений осуществляется свободное скрещивание. В случаях проведения анализа в небольших или имеющих явно выраженное подразделение популяциях применяются специальные методы оценки достоверности, рассмотрение которых не входит в нашу задачу.
Метод оценки результатов, основанный на расчете вероятности случайного совпадения генетических признаков
Данный метод применим для анализа полученных результатов установления только таких степеней родства, для которых наличие общих аллелей в генотипах родственных лиц является обязательным.
Оценка достоверности положительного вывода проводится в следующей последовательности:
1. На основе популяционных данных для каждого локуса проводится расчет вероятности (Pслуч i) того, что наблюдаемое совпадение аллелей в генотипах исследуемых лиц, характерное для тестируемой степени родства, обусловлено случайностью. Другими словами, это вероятность того, что случайно выбранный человек обладает таким генотипом по данному локусу, который, будучи проанализирован на соответствие исследуемойстепени родства, также свидетельствовал бы в пользу истинности родства. Эта вероятность равна (для больших популяций) суммарной частоте встречаемости таких генотипов. Например, если при проведении анализа на отцовство у ребенка в генотипе по определенному локусу выявлен аллель отцовского происхождения q, то вероятностью случайного совпадения аллелей для данного локуса будет являться суммарная частота встречаемости всех генотипов по данному локусу, содержащих хотя бы один этот аллель q.
При расчетах частот встречаемости генотипов используются данные популяционных исследований о частотах аллелей, применяемых в исследовании локусов. При условии, что популяция находится в состоянии равновесия Харди-Вайнберга для определенного локуса, частота генотипа ab по данному локусу P(ab) может быть рассчитана по следующим формулам:
Где pa и pb – популяционные частоты аллелей a и b соответственно.
2. Проводится расчет вероятности того, что наблюдаемое совпадение аллелей в генотипах исследуемых лиц, характерное для тестируемойстепени родства, произошло случайно одновременно во всех исследуемых локусах. Это вероятность того, что случайно выбранный человек обладает таким генотипом по всей совокупности исследуемых локусов, что генотип по каждому локусу, будучи проанализирован на соответствие исследуемой степени родства, свидетельствовал бы в пользу истинности родства. Если в популяции наблюдается равновесие по сцеплению между любыми двумя локусами, то генотипы по отдельным локусам не зависят друг от друга и частота определенного генотипа по группе локусов равна произведению частот генотипов по отдельным локусам. Таким образом, вероятность (Pслуч) случайного совпадения для совокупности исследуемых локусов равна произведению вероятностей (Pслуч i) случайного совпадения для отдельных локусов:
Заметим, что значение Pслуч равно доле лиц в рассматриваемой популяции, для которых, при проведении анализа на соответствующую степень родства, было бы показано неисключение родства.
3. Вычисляется вероятность исключения PE (от английского словосочетания Probability of Exclusion):
Значение вероятности исключения и является искомой оценкой достоверности положительного заключения о родстве. Величина PE показывает долю лиц в популяции, в отношении которых анализ, проведенный на основе данной системы локусов, показал бы исключение родства как минимум по одному локусу.
Далее приведены примеры расчета вероятности случайного совпадения генетических признаков для отдельного локуса при проведении анализа на отцовство.
Пример 1. Рассчитаем вероятность случайного совпадения для одного локуса в случае установления отцовства, когда анализируются генотипы ребенка, матери, предполагаемого отца и генотипы матери и ребенка однозначно определяют аллель отцовского происхождения в генотипе ребенка.
В таблице 3 приведены значения Pслуч i для всех возможных сочетаний генотипов ребенка, матери и предполагаемого отца, свидетельствующих в пользу истинности отцовства.
Таблица 3. Значения вероятности случайного совпадения Pслуч i генетических признаков, когда генотипы по данному локусу ребенка, матери и предполагаемого отца свидетельствуют в пользу истинного отцовства
Генотип ребенка
|
Генотип матери
|
Генотип
предполагаемого отца |
Pслуч i
|
---|---|---|---|
Ребенок и мать одинаковые гомозиготы | |||
aa | aa | aa ab |
pa(2-pa) |
Ребенок гомозигота, мать гетерозигота | |||
aa | ab | aa ab ac |
pa(2-pa) |
Ребенок гетерозигота, мать гомозигота | |||
ab | bb | aa ab ac |
pa(2-pa) |
Ребенок и мать различные гетерозиготы | |||
ab | bc | aa ab ac ad |
pa(2-pa) |
Ребенок и мать одинаковые гетерозиготы | |||
ab | ab | aa bb ab ac bc |
(pa+pb)(2-(pa+pb)) |
Приведены все возможные сочетания таких генотипов. pa и pb - популяционные частоты аллелей a и b соответственно.
Пример 3. Рассчитаем вероятность случайного совпадения для данного локуса в случае установления отцовства, когда анализируются генотипы ребенка и предполагаемого отца.
Рассмотрим генотипы по данному локусу, представленные на Рис. 34.
Генотип дочери – ab, генотип отца - ca . В данном случае генотип матери по анализируемому локусу недоступен и мы не можем установить, какой аллель получен от матери, и соответственно не можем определить аллель отцовского происхождения в генотипе ребенка. Тем не менее, наличие в генотипе предполагаемого отца аллеля a, совпадающего с одним из аллелей в генотипе дочери, свидетельствует в пользу истинногоотцовства. Для любого другого мужчины, у которого генотип по данному локусу содержит хотя бы один из аллелей генотипа ребенка a или b, также было бы получено свидетельство в пользу истинности отцовства. Таким образом, вероятность случайного совпадения генетических признаков, в данном случае, это суммарная частота всех генотипов по данному локусу, в которых присутствует хотя бы один из аллелей a и b.
Расчет вероятности случайного совпадения проводим аналогично расчетам Примера 2. В итоге получаем:
В таблице 4 приведены значения Pслуч i для всех возможных сочетаний генотипов ребенка и предполагаемого отца, свидетельствующих в пользу истинности отцовства.
Таблица 4. Значения вероятности случайного совпадения Pслуч i генетических признаков, когда генотипы по данному локусу ребенка и предполагаемого отца свидетельствуют в пользу истинного отцовства
Генотип ребенка
|
Генотип
предполагаемого отца |
Pслуч i
|
---|---|---|
Ребенок гомозигота | ||
aa | aa ab |
pa(2-pa) |
Ребенок гетерозигота | ||
ab | aa bb ab ac bc |
(pa+pb)(2-(pa+pb)) |
Приведены все возможные сочетания таких генотипов. pa и pb - популяционные частоты аллелей a и b соответственно.
Метод оценки результатов, основанный на расчете условных вероятностей генотипов
Данный метод применим для анализа полученных результатов как степеней родства, для которых наличие общих аллелей в генотипах родственных лиц является обязательным, так и степеней родства, для которых вероятность наличия в генотипах совпадающих аллелей для родственников выше, чем для неродственных лиц. Этот подход основан на применении теоремы Байеса из теории вероятностей.
Теорема Байеса: Пусть H1, H2, … - полная группа событий (т.е. ), и E – некоторое событие, наблюдаемое в результате эксперимента, проведенного после того, как произошло одно из событий Нj, тогда для любых двух событий Нi и Нk справедливо следующее соотношение:
где P(Hi) – априорная (то есть существовавшая до проведения эксперимента) вероятность того, что из всех возможных событий, составляющих полную группу, произошло именно событие Hi;
P(E|Hi) – вероятность наблюдать в результате эксперимента событие E при условии, что имело место именно событие Hi;
P(Hi|E) – апостериорная (то есть определяемая после проведения эксперимента и с учетом его результатов) вероятность того, что из всех возможных событий, составляющих полную группу, произошло именно событие Hi, при условии, что в результате эксперимента наблюдалось событие E.
Для трех членов уравнения (1) существуют общепринятые термины:
Таким образом, выражение (1) можно записать в следующем виде:
Перейдем к тому, как приведенные выше соотношения применяются для оценки достоверности полученных результатов при установлении родства.
- В качестве полной группы событий (Hj) берутся взаимоисключающие гипотезы о наличии или отсутствии родства между исследуемыми лицами. Как правило это две альтернативные гипотезы:
Hрод – рассматриваемые лица действительно находятся в родстве;
Hнерод – рассматриваемые лица не являются родственниками проверяемой степени родства. - В качестве наблюдаемого результата эксперимента E берется совокупность выявленных генотипов исследуемых лиц.
- С помощью популяционных данных о частоте аллелей, для полученных генотипов исследуемых лиц по каждому из исследуемых локусов проводится расчет отношения правдоподобий событий Hрод и Hнерод.
- Проводится расчет отношения правдоподобий событий Hрод и Hнерод для генотипов исследуемых лиц по всей совокупности локусов. При выполнении определенных условий, накладываемых на систему локусов, используемую в исследовании, отношение правдоподобий для совокупности локусов равно произведению отношений правдоподобий для отдельных локусов. Упомянутые условия, налагаемые на систему локусов, вообще говоря, различаются как для аутосомных систем и систем локусов половых хромосом, так и для случаевустановления различных степеней родства. В большинстве случаев требования сводятся к независимости локусов и наличию равновесия по сцеплению между ними или к выполнению одного из этих условий.
Полученное значение отношения правдоподобий LR показывает, во сколько раз вероятность наблюдать выявленные генотипы исследуемых лиц в случае истинности устанавливаемой степени родства больше вероятности наблюдать эти генотипы в случае, когда родство отсутствует.
Величина LR может служить мерой уровня достоверности положительного заключения о родстве, однако желательно иметь возможность рассчитать значение P(Hрод|E) – вероятность того, что исследуемые лица действительно состоят в указанной степени родства при условии, что они имеют выявленные генотипы, то есть вероятность родства. Запишем выражение (1) для случая установления родства:
Если известно априорное отношение вероятностей родства и неродства, то возможно вычислить апостериорную вероятность родства. Действительно, учитывая, что P(Hнерод|E)=1-P(Hрод|E), получаем:
В настоящее время при расчете апостериорной вероятности родства принято постулировать значение априорного отношения вероятностей как 1 (единица). (Правомерность такого постулирования выходит за рамки нашего рассмотрения). При значении априорного отношения вероятностей, равному единице, выражение для апостериорной вероятности родства принимает вид:
Заметим, что при таком подходе значение апостериорной вероятности родства однозначно определяется значением отношения правдоподобийLR.
При формировании положительного заключения о родстве в качестве уровня достоверности результата указывается либо только значение отношения правдоподобий LR, либо значение апостериорной вероятности родства, с обязательным указанием использованного значения априорного отношения вероятностей родства и неродства.
Для отношения правдоподобий в случаях анализа отцовства используется специальный термин - индекс отцовства PI (Paternity Index).
Далее приведен пример расчета индекса отцовства для отдельного локуса при проведении анализа на отцовство.
Пример 4. Рассчитаем индекс отцовства для данного локуса в случае установления отцовства, когда анализируются генотипы ребенка, матери, предполагаемого отца и генотипы матери и ребенка однозначно определяют аллель отцовского происхождения в генотипе ребенка.
Рассмотрим Рис. 35.
Генотип дочери – ab, матери – bd. Так как мать считается априори родной и только аллель b присутствует как в генотипе матери, так и в генотипе дочери, то именно аллель b является аллелем материнского происхождения в генотипе дочери. Аллель a в генотипе дочери является аллелем отцовского происхождения. Так как в генотипе предполагаемого отца ca содержится аллель a, совпадающий с аллелем отцовского происхождения в генотипе дочери, то рассматриваемые генотипы свидетельствуют в пользу истинности отцовства.
Индекс отцовства PI для генотипов по данному локусу равен отношению вероятности наблюдать эти генотипы при условии, что предполагаемый отец приходится биологическим отцом ребенку, к вероятности наблюдать эти генотипы при условии, что отцом ребенка является неизвестный мужчина.
Сначала определим значение для P(E|Hрод). Так как предполагается, что в рассматриваемой популяции скрещивание происходит неассортативно, то есть вероятность встречи партнеров не зависит от их генотипов, то генотипы родителей не зависят друг от друга. Вероятность генотипа ребенка полностью определяется генотипами его биологических родителей. Следовательно, значение P(E|Hрод) равно произведению частот генотипов матери P(bd), предполагаемого отца P(ca) и вероятности генотипа ребенка при условии, что предполагаемый отец приходится ему биологическим отцом. В данном примере мать и предполагаемый отец являются гетерозиготами по рассматриваемому локусу, причем в их генотипах отсутствуют совпадающие аллели. В таком случае ребенок данной пары с равной вероятностью будет иметь один из четырех генотипов ab, ad, cb и cd. Таким образом, вероятность данного генотипа ребенка ab при условии, что предполагаемый отец приходится ему биологическим отцом, равна ¼. В итоге получаем:
Теперь определим значение P(E|Hнерод). Как и в случае расчета P(E|Hрод), значение P(E|Hнерод) равно произведению частот генотипов материP(bd), предполагаемого отца P(ca) и вероятности генотипа ребенка при условии, что предполагаемый отец не приходится ему биологическим отцом. Генотип ребенка – ab. Как уже говорилось выше, аллелем материнского происхождения в генотипе ребенка является аллель b. Генотип матери – bd. Своим детям она с равной вероятностью передаст как аллель b, так и аллель d, следовательно, вероятность того, что при данном генотипе матери bd аллелем материнского происхождения у ребенка окажется аллель b, равна ½. Алллелем отцовского происхождения в генотипе ребенка является аллель a. При условии, что биологическим отцом ребенку приходится неизвестный мужчина, вероятность того, что аллелем отцовского происхождения в генотипе ребенка будет аллель a, равна популяционной частоте pa аллеля a. Так как вероятность определенного генотипа равна произведению вероятностей аллелей отцовского и материнского происхождения, вероятность данного генотипа ребенка ab при условии, что биологическим отцом ему приходится неизвестный мужчина, равна (1/2)× pa. В итоге получаем:
Теперь можно рассчитать искомое значение индекса отцовства PI:
Таблица 5. Значения индекса отцовства PI , когда генотипы по данному локусу ребенка, матери и предполагаемого отца свидетельствуют в пользу истинного отцовства
Генотип ребенка
|
Генотип матери
|
Генотип
предполагаемого отца |
PI
|
---|---|---|---|
Ребенок и мать одинаковые гомозиготы | |||
aa | aa | aa ab |
1/(pa) 1/(2pa) |
Ребенок гомозигота, мать гетерозигота | |||
aa | ab | aa ab ac |
1/(pa) 1/(2pa) 1/(2pa) |
Ребенок гетерозигота, мать гомозигота | |||
ab | bb | aa ab ac |
1/(pa) 1/(2pa) 1/(2pa) |
Ребенок и мать различные гетерозиготы | |||
ab | bc | aa ab ac ad |
1/(pa) 1/(2pa) 1/(2pa) 1/(2pa) |
Ребенок и мать одинаковые гетерозиготы | |||
ab | ab | aa bb ab ac bc |
1/(pa+pb) 1/(pa+pb) 1/(pa+pb) 1/(2pa+2pb) 1/(2pa+2pb) |
Приведены все возможные сочетания таких генотипов. pa и pb - популяционные частоты аллелей a и b соответственно.
Таблица 6. Значения индекса отцовства PI , когда генотипы по данному локусу ребенка и предполагаемого отца свидетельствуют в пользу истинного отцовства
Генотип ребенка
|
Генотип
предполагаемого отца |
PI
|
---|---|---|
Ребенок и отец одинаковые гомозиготы | ||
aa | aa | 1/(pa) |
Ребенок гомозигота, отец гетерозигота | ||
aa | ab | 1/(2pa) |
Ребенок гетерозигота, отец гомозигота | ||
ab | aa | 1/(2pa) |
Ребенок и отец гетерозиготы | ||
ab | ab ac |
(pa+pb)/(4papb) 1/(4pa) |
Приведены все возможные сочетания таких генотипов. pa и pb - популяционные частоты аллелей a и b соответственно.
«Комбинированный» метод оценки результатов
В ряде лабораторий используется подход к оценке достоверности положительного вывода о родстве, который формально основан на использовании теоремы Байеса и вычислении отношений правдоподобий, однако, фактически является модификацией метода, основанного на расчете вероятности случайного совпадения.
Для наглядности разберем данный подход на примере установления отцовства в случае, когда анализируются генотипы ребенка, матери и предполагаемого отца.
Полное событие E, наблюдаемое в результате проведенного эксперимента (типирования исследуемых лиц), и относительно которого проводится расчет условных вероятностей при обычном вычислении индекса отцовства PI, представляет собой совокупность трех наблюдаемых «событий»:
- Генотип матери по данному локусу;
- Генотип ребенка по данному локусу;
- Генотип предполагаемого отца по данному локусу.
На основании этих данных можно вывести следующее «событие»: - Генотипы по данному локусу исследуемых лиц свидетельствуют в пользу истинности отцовства.
При «комбинированном» подходе в качестве полного события E принимается не совокупность событий 1, 2 и 3, а совокупность событий 1, 2 и4. При такой интерпретации события E условные вероятности, рассчитываемые для вычисления индекса отцовства, принимают следующие значения.
Вероятность наблюдать событие E при условии, что предполагаемый отец приходится биологическим отцом ребенку:
Вероятность наблюдать событие E при условии, что отцом ребенка является неизвестный мужчина:
где Pслуч i - вероятность случайного совпадения генетических признаков для данного локуса.
Соответственно значения для отношений правдоподобий будут равны:
Вероятность отцовства PP (Probability of Paternity) при принятии априорного отношения вероятностей родства и неродства равным единице в данном случае будет равна:
Хотя данный подход, наверное, имеет право на существование, он обладает следующим недостатком:
При расчетах условных вероятностей, и соответственно индекса отцовства и вероятности отцовства, никак не учитывается генотип предполагаемого отца, то есть происходит потеря генетической информации.
В данной ситуации использование общепринятых терминов индекс отцовства (PI) и вероятность отцовства (PP) представляется некорректным.