ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 09.11.2023
Просмотров: 3194
Скачиваний: 365
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
1 ... 11 12 13 14 15 16 17 18 ... 35
Таблица 3 Оценка полигенности для одного человека на основе десяти SNP
Взвешенные генотипические баллы в последнем столбце таблицы представляют собой произведение генотипического балла для каждого SNP и корреляции с признаком.
Сумма этих взвешенных генотипических оценок для десяти SNP равна
0,023. Это число не так поддается интерпретации, как невзвешенная генотипическая оценка 9, которая представляет собой просто сумму «возрастающих» аллелей. Однако как невзвешенная полигенная оценка 9, так и взвешенная оценка 0,023 могут быть выражены просто как процентиль в популяции. Для этого человека оба типа указывают на полигенность чуть ниже среднего.
Сколько SNP должно войти в полигенную оценку ? Первоначально полигенные оценки были созданы с использованием только значимых «попаданий» для всего генома из исследования GWA. Что касается веса, девяносто семь независимых SNP достигли общегеномной значимости. Создание полигенной оценки из этих девяноста семи SNP объясняет 1,2% дисперсии веса в независимых выборках. Это лишь немногим лучше, чем прогноз самого FTO SNP, который объясняет 0,7% дисперсии.
Использование только значимых совпадений для всего генома — это то же самое, что требовать, чтобы каждый элемент нашей шкалы застенчивости сам по себе был значительным предсказателем. Мы не делаем этого для других психологических оценок, потому что нереально ожидать, что каждый пункт будет стоять сам по себе. Цель состоит в том, чтобы максимально использовать составную шкалу.
Идея получше состоит в том, чтобы делать то, что мы делаем, когда создаем другие психологические оценки: продолжайте добавлять пункты, пока они повышают надежность и достоверность композита в независимых выборках. Для полигенных оценок ключевым критерием является предсказание. Новый подход к полигенным показателям состоит в том, чтобы продолжать добавлять SNP до тех пор, пока они увеличивают прогностическую способность полигенного показателя в независимых выборках. Это стратегия, которая за последние два года окупилась благодаря получению мощных полигенных оценок психологических черт. Некоторые ложноположительные результаты будут включены в полигенную оценку, но это приемлемо, пока сигнал увеличивается по сравнению с шумом в том смысле, что полигенная оценка предсказывает большую дисперсию.
Например, для ИМТ полигенная оценка, основанная на девяносто семи значимых для всего генома SNP, предсказывает 1 процент дисперсии, а полигенная оценка, включающая 2000 SNP, предсказывает 4 процента дисперсии ИМТ. Включение еще большего количества SNP в полигенную оценку увеличивает прогноз до 6 процентов дисперсии. Многие ложноположительные SNP проникают в эту полигенную оценку, но они не портят прогноз, они просто не помогают. Увеличение прогностической способности полигенной оценки с 1% до 6% делает это очень приемлемым компромиссом между сигналом и шумом.
Для сложных признаков и распространенных расстройств этот новый подход к полигенным показателям включает не только десять, сотню или даже тысячу SNP. Как правило, в полигенные баллы включаются десятки тысяч SNP, иногда сотни тысяч. Это эмпирический метод — продолжайте добавлять SNP до тех пор, пока они увеличивают способность прогнозировать в независимых выборках.
Сводная статистика GWA, необходимая для создания полигенных оценок, в настоящее время доступна для сотен признаков в области биологии и медицины, а также психологии. После публикации исследования GWA многие исследователи делают свои сводные статистические данные GWA общедоступными, чтобы любой мог использовать их для создания полигенных оценок. Чтобы дать представление о взрывном росте исследований GWA за последнее десятилетие, основное хранилище этих результатов включает сводную статистику GWA для 173 признаков, основанную на 1,5 миллионах человек и 1,4 миллиардах ассоциаций SNP-признаков. Эти черты включают двадцать психологических черт и расстройств и переменных, имеющих отношение к психологии, таких как социальная депривация, курение, продолжительность сна, возраст наступления менархе и менопаузы и возраст смерти отца. Они также включают физиологические черты, имеющие отношение к психологии, такие как иммунологические и метаболические биомаркеры.
Нельзя не отметить, что это только начало эры полигенных партитур. Хотя сводная статистика GWA общедоступна для более чем 200 признаков, анализы GWA были зарегистрированы для сотен других признаков, которые в конечном итоге будут добавлены в список возможных оценок полигенности по мере того, как их сводная статистика станет доступной. Кроме того, более крупные и качественные исследования GWA будут постоянно давать более мощные полигенные оценки для всех признаков.
В оставшейся части этой главы я поделюсь своими полигенными показателями роста и веса, чтобы исследовать некоторые общие вопросы, связанные с этими показателями. Они дают конкретные иллюстрации того, как полигенные оценки предвещают эру личной геномики в психологии. При создании моих полигенных оценок мы использовали самые последние опубликованные исследования GWA, описанные в предыдущей главе, хотя в каждом случае в работе находится анализ GWA гораздо более крупных выборок. К тому времени, когда вы будете это читать, следующая оценка будет консервативной оценкой мощности полигенных оценок.
Полигенные оценки требуют ДНК, полногеномного генотипирования и большого количества анализов. Менее чем за 100 фунтов стерлингов компании, работающие непосредственно с потребителем, извлекут вашу ДНК из слюны и проведут полногеномное генотипирование с использованием SNP-чипов. Эти компании сосредоточились на нарушениях одного гена, но одно и то же полногеномное генотипирование можно использовать для создания полигенных показателей. Компании начинают повторно анализировать данные о генотипах SNP, чтобы предоставить широкой публике оценки полигенности. Одни и те же генотипы SNP можно использовать для создания полигенных оценок для любого признака, для которого доступны результаты GWA.
Чтобы проиллюстрировать полигенное предсказание с помощью моей собственной ДНК, необходима большая сравнительная выборка с аналогичными построенными полигенными баллами для каждого человека. Затем мы можем увидеть, где находятся мои оценки полигенности в распределении любой из сотен доступных в настоящее время оценок полигенности. Никаких фенотипических данных не требуется — только ДНК. То есть, ничего не зная о моих депрессивных симптомах, я могу сравнить свою полигенную оценку депрессии с полигенными оценками сравнительной выборки.
Моя команда и я создали полигенные оценки для широкого спектра признаков, используя мои генотипы SNP, полученные из SNP-чипа в нашей лаборатории на основе результатов исследований GWA, описанных в предыдущей главе. Мы сравнили мои полигенные баллы с баллами выборки из 6000 неродственных людей, участвовавших в моем исследовании раннего развития близнецов в Великобритании. Неважно, что в эту группу сравнения входят молодые люди, потому что ДНК не меняется — группой сравнения могут быть и младенцы.
наиболее прогностическим полигенным показателем является рост, который объясняет 17% дисперсии роста взрослых. Хотя рост не является психологической чертой, он полезен как беспристрастный пример для понимания того, как работают полигенные оценки и как их интерпретировать. Мы использовали результаты GWA для роста, чтобы создать полигенные оценки для меня и для каждого человека в выборке ЭТДП. Полигенная оценка, полученная из GWA роста взрослого человека, предсказывает 15% дисперсии роста молодых людей в TEDS.
Чтобы интерпретировать полигенные оценки, важно помнить, что они всегда распределяются по колоколообразной кривой, то есть по нормальному распределению. Эта колоколообразная кривая продиктована фундаментальным законом вероятности или центральной предельной теоремой , лежащей в основе всей статистики. Нормальное распределение обнаруживается, когда множество случайных событий вносят свой вклад в явление, например, подбрасывание монеты и подсчет количества раз, когда монета выпадает орлом. Если вы подбросите монету десять раз, вы можете не получить ни одного орла или десять орлов подряд, но в большинстве случаев общее количество орлов будет от четырех до семи. Если вы сделаете это много раз, вы получите совершенно нормальное распределение в форме колокола, достигающее максимума в пять, что и будет средним числом орлов. Подбрасывание монет и подсчет решек в точности аналогичны подсчету количества «растущих» аллелей из SNP для построения полигенных оценок для многих людей.
Я опишу все свои полигенные баллы в виде процентилей нормального распределения. То есть насколько моя полигенная оценка выше или ниже средней полигенной оценки в выборке сравнения, 50-м процентиле? Оказывается, моя полигенная оценка роста находится на уровне 90-го процентиля. Итак, основываясь только на моей ДНК, ничего не зная обо мне, вы можете предсказать, что я высокий. И, на самом деле, я 6 футов 5 дюймов. Конечно, вы могли бы легко увидеть, что я высокий, если бы увидели меня, но с ДНК вы могли бы сказать, что я высокий, даже не глядя на меня.