ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 09.11.2023
Просмотров: 3140
Скачиваний: 364
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
путем исправления ассоциаций для миллиона тестов по всему геному». , поправка на миллион тестов означает, что значение P, используемое в исследованиях GWA, равно 0,00000005.
' Генотипы SNP подсчитываются как 0, 1 или 2, что указывает на количество «возрастающих» аллелей : например, FTO SNP на хромосоме 16 состоит из двух аллелей, Т и А. Аллель А связан с увеличением веса на три фунта. У каждого из нас есть два аллеля SNP, по одному на каждой из двух наших хромосом. Наш генотип для FTO SNP может быть ТТ, ТА или АА. Мы можем подсчитать количество аллелей А в генотипе, чтобы человек имел генотипическую оценку 0, 1 или 2, в зависимости от того, является ли его генотип ТТ, ТА или АА соответственно. Более высокий балл для этого SNP указывает на большую массу тела. Поскольку каждый аллель А добавляет в среднем три фунта, люди с генотипом ТТ в среднем на три фунта легче, чем люди с генотипом ТА, которые на три фунта легче, чем люди с генотипом АА. Именно это подразумевается под аддитивными генотипическими эффектами — каждый аллель А добавляет 3 фунта. Кроме того, как и в любой психологической шкале, каждый SNP необходимо суммировать в правильном направлении, чтобы общая полигенная оценка предсказывала больший вес. Аллель A FTO SNP связан с большим весом. Для других SNP в анализе веса GWA любой аллель, связанный с большим весом, считается за 1. Оценка полигенности каждого человека основана на том, имеет ли человек 0, 1 или 2 копии этого аллеля. Таким образом, более высокий полигенный балл предсказывает большую массу тела. '
Сколько SNP должно войти в полигенную оценку? ' : В исследованиях GWA средний размер эффекта высших ассоциаций SNP составляет около 0,01%. Это говорит о том, что для оценки полигенности требуется не менее 5000 SNP, чтобы учесть наследуемость в 50%, если средний размер эффекта составляет 0,01%. На самом деле потребуется намного больше, чем 5000 SNP, потому что размеры эффекта ассоциаций GWA включают ошибку. Как правило, в полигенные оценки включаются десятки тысяч SNP. Один из подходов состоит в том, чтобы продолжать добавлять SNP до тех пор, пока они увеличивают способность прогнозировать в независимых выборках : Jack Euesden et al., 'PRSice: Polygenic Risk Score Software', Bioinformatics , 31 (2015): 146-8. doi: 10.1093/биоинформатика/btu848. Полигенные оценки иногда включают все SNP: Cornelius A. Rietveld et al., 'GWAS of
126 559 человек идентифицируют генетические варианты, связанные с уровнем образования», Science , 340 (2013): 1467-71. doi
: 10.1126/science.1235488. Чтобы создать мои полигенные оценки, мы использовали новый подход, называемый LDpred , который корректирует корреляцию (неравновесие по сцеплению) между SNP, чтобы избежать «двойного подсчета» коррелирующих SNP. LDpred также оптимизирует информацию обо всех SNP, а не только о SNP, наиболее тесно связанных с признаком: Bjami J. Vilhjalmsson et al., «Моделирование неравновесия по сцеплению повышает точность показателей полигенного риска», American Journal of Human Genetics, 97 (2015 г. ) . ): 576-92.
doi:10.1016/j.ajhg.2015.09.001.
' Чтобы дать ощущение взрыва GWA исследований за последнее десятилетие, основное хранилище этих результатов включает сводную статистику GWA по 173 признакам, основанную на 1,5 миллионах индивидуумов и 1,4 миллиардах ассоциаций SNP-признаков»: Zheng et al., «LD Hub: Централизованная база данных и веб-интерфейс для выполнения Регрессия оценки LD, которая максимизирует потенциал данных GWAS суммарного уровня для анализа наследуемости SNP и генетической корреляции», Bioinformatics , 33 (2017): 272-9. doi: 10.1093/биоинформатика/btw613.
« В оставшейся части этой главы я поделюсь своими полигенными показателями роста и веса, чтобы исследовать некоторые общие вопросы, поднятые этими показателями» : Моя команда и я собрали мою ДНК из слюны и выделили ДНК, как описано ранее. Затем мы генотипировали мою ДНК по сотням тысяч SNP на SNP-чипе. Мы использовали SNP-чип Illumina Infinium OmniExpress SNP, который генотипирует 600 000 SNP в геноме. После скрининга контроля качества мы получили 562 199 генотипированных SNP. Как обычно, мы использовали эти измеренные SNP для определения ближайших SNP на основе эталонных панелей с данными полногеномного секвенирования большого числа людей. Вменение включает в себя вывод SNP из эталонных панелей, которые сильно коррелируют (т. е. находятся в неравновесии по сцеплению) с нашими измеренными SNP. Мы добавили 7 323 859 предполагаемых SNP, которые использовались вместе с измеренными SNP для построения моих полигенных оценок по результатам исследований GWA.
После генотипирования ДНК на SNP-чипе необходимо проделать большую работу, чтобы разобраться в необработанных данных SNP. Это начинается с серии анализов контроля качества, которые отсеивают ошибки SNP. Конечным продуктом является создание сотен тысяч генотипов SNP для каждого человека. Эти анализы утомительны, но теперь, после десятилетия работы с чипами SNP, стали обычным делом. Еще не рутинным является создание полигенных оценок, которые стали широко использоваться только в последние два года. Сводная статистика для каждого из сотен тысяч SNP из большого исследования GWA для определенного признака необходима для обеспечения весов для получения полигенных оценок для этого признака. Для улучшения показателей полигенности изобретается множество ухищрений, например учет того факта, что SNP, расположенные близко друг к другу на хромосоме, коррелируют.
« Наиболее прогностической полигенной оценкой на данный момент является рост, который объясняет 17% вариаций роста взрослых » Архитектура роста взрослого человека», Nature Genetics, 46 (2014): 1173-86. doi: 10.1038/ng.3097. На главные ассоциации SNP для роста приходится в среднем 0,07% дисперсии, что соответствует эффекту 0,05 см.
« Этот разрыв [между предсказанием признака по полигенной шкале и наследуемостью признака] называется отсутствующей наследственностью» : Брендан Махер, «Персональные геномы: случай отсутствующей наследственности», Nature , 456 (2008): 18–21. . дои: 10.1038/456018a . Отсутствие наследуемости является ключевой проблемой для всех сложных признаков в науках о жизни .
Отсутствие наследственности называют «темной материей» полногеномной ассоциации, потому что, хотя она определенно существует, мы не можем ее увидеть. Этот недостающий разрыв в наследуемости будет сокращаться по мере того, как исследования GWA будут расширяться и улучшаться. Используя современные технологии, мы должны быть в состоянии более чем удвоить прогностическую силу полигенных оценок с большими выборками GWA. Еще одна причина для оптимизма заключается в том, что чипы SNP, используемые в исследованиях GWA, в основном включают общие SNP, но большинство различий ДНК не являются общими. Было подсчитано, что современные чипы SNP составляют лишь около половины всей генетической изменчивости генома. Тери А. Манолио и др., «Поиск недостающей наследственности комплексного заболевания», Nature , 461 (2009): 747-53. дои: 10.1038/nature08494. Фрэнк Дадбридж, «Мощность и точность прогнозирования показателей полигенного риска», PLoS Genetics , 9 (2013): doi: 10.1371/journal.pgen.1003348.
Поскольку полногеномное секвенирование фиксирует все унаследованные различия ДНК, а не только общие SNP, оно может удвоить прогностическую силу полигенных оценок. Этот вывод подтверждается новым методом оценки наследуемости, называемым наследуемостью SNP , поскольку он основан на прямом измерении SNP ДНК. Наследуемость SNP оценивает корреляцию между SNP и сходством признаков для неродственных людей среди сотен тысяч SNP на чипе SNP. Хотя в настоящее время существует несколько способов оценки наследуемости SNP, первый метод назывался Анализ комплексных признаков всего генома ( GCTA ): Jian Yang et al., 'Common SNPs Explain a Large Proportion of the Heritability for Human Height', Nature Genetics , 42 (2010): 565-9. doi: 10.1038/ng.608. Цзянь Ян и др., «Разделение генома генетической изменчивости для сложных признаков с использованием
' Генотипы SNP подсчитываются как 0, 1 или 2, что указывает на количество «возрастающих» аллелей : например, FTO SNP на хромосоме 16 состоит из двух аллелей, Т и А. Аллель А связан с увеличением веса на три фунта. У каждого из нас есть два аллеля SNP, по одному на каждой из двух наших хромосом. Наш генотип для FTO SNP может быть ТТ, ТА или АА. Мы можем подсчитать количество аллелей А в генотипе, чтобы человек имел генотипическую оценку 0, 1 или 2, в зависимости от того, является ли его генотип ТТ, ТА или АА соответственно. Более высокий балл для этого SNP указывает на большую массу тела. Поскольку каждый аллель А добавляет в среднем три фунта, люди с генотипом ТТ в среднем на три фунта легче, чем люди с генотипом ТА, которые на три фунта легче, чем люди с генотипом АА. Именно это подразумевается под аддитивными генотипическими эффектами — каждый аллель А добавляет 3 фунта. Кроме того, как и в любой психологической шкале, каждый SNP необходимо суммировать в правильном направлении, чтобы общая полигенная оценка предсказывала больший вес. Аллель A FTO SNP связан с большим весом. Для других SNP в анализе веса GWA любой аллель, связанный с большим весом, считается за 1. Оценка полигенности каждого человека основана на том, имеет ли человек 0, 1 или 2 копии этого аллеля. Таким образом, более высокий полигенный балл предсказывает большую массу тела. '
Сколько SNP должно войти в полигенную оценку? ' : В исследованиях GWA средний размер эффекта высших ассоциаций SNP составляет около 0,01%. Это говорит о том, что для оценки полигенности требуется не менее 5000 SNP, чтобы учесть наследуемость в 50%, если средний размер эффекта составляет 0,01%. На самом деле потребуется намного больше, чем 5000 SNP, потому что размеры эффекта ассоциаций GWA включают ошибку. Как правило, в полигенные оценки включаются десятки тысяч SNP. Один из подходов состоит в том, чтобы продолжать добавлять SNP до тех пор, пока они увеличивают способность прогнозировать в независимых выборках : Jack Euesden et al., 'PRSice: Polygenic Risk Score Software', Bioinformatics , 31 (2015): 146-8. doi: 10.1093/биоинформатика/btu848. Полигенные оценки иногда включают все SNP: Cornelius A. Rietveld et al., 'GWAS of
126 559 человек идентифицируют генетические варианты, связанные с уровнем образования», Science , 340 (2013): 1467-71. doi
1 ... 27 28 29 30 31 32 33 34 35
: 10.1126/science.1235488. Чтобы создать мои полигенные оценки, мы использовали новый подход, называемый LDpred , который корректирует корреляцию (неравновесие по сцеплению) между SNP, чтобы избежать «двойного подсчета» коррелирующих SNP. LDpred также оптимизирует информацию обо всех SNP, а не только о SNP, наиболее тесно связанных с признаком: Bjami J. Vilhjalmsson et al., «Моделирование неравновесия по сцеплению повышает точность показателей полигенного риска», American Journal of Human Genetics, 97 (2015 г. ) . ): 576-92.
doi:10.1016/j.ajhg.2015.09.001.
' Чтобы дать ощущение взрыва GWA исследований за последнее десятилетие, основное хранилище этих результатов включает сводную статистику GWA по 173 признакам, основанную на 1,5 миллионах индивидуумов и 1,4 миллиардах ассоциаций SNP-признаков»: Zheng et al., «LD Hub: Централизованная база данных и веб-интерфейс для выполнения Регрессия оценки LD, которая максимизирует потенциал данных GWAS суммарного уровня для анализа наследуемости SNP и генетической корреляции», Bioinformatics , 33 (2017): 272-9. doi: 10.1093/биоинформатика/btw613.
« В оставшейся части этой главы я поделюсь своими полигенными показателями роста и веса, чтобы исследовать некоторые общие вопросы, поднятые этими показателями» : Моя команда и я собрали мою ДНК из слюны и выделили ДНК, как описано ранее. Затем мы генотипировали мою ДНК по сотням тысяч SNP на SNP-чипе. Мы использовали SNP-чип Illumina Infinium OmniExpress SNP, который генотипирует 600 000 SNP в геноме. После скрининга контроля качества мы получили 562 199 генотипированных SNP. Как обычно, мы использовали эти измеренные SNP для определения ближайших SNP на основе эталонных панелей с данными полногеномного секвенирования большого числа людей. Вменение включает в себя вывод SNP из эталонных панелей, которые сильно коррелируют (т. е. находятся в неравновесии по сцеплению) с нашими измеренными SNP. Мы добавили 7 323 859 предполагаемых SNP, которые использовались вместе с измеренными SNP для построения моих полигенных оценок по результатам исследований GWA.
После генотипирования ДНК на SNP-чипе необходимо проделать большую работу, чтобы разобраться в необработанных данных SNP. Это начинается с серии анализов контроля качества, которые отсеивают ошибки SNP. Конечным продуктом является создание сотен тысяч генотипов SNP для каждого человека. Эти анализы утомительны, но теперь, после десятилетия работы с чипами SNP, стали обычным делом. Еще не рутинным является создание полигенных оценок, которые стали широко использоваться только в последние два года. Сводная статистика для каждого из сотен тысяч SNP из большого исследования GWA для определенного признака необходима для обеспечения весов для получения полигенных оценок для этого признака. Для улучшения показателей полигенности изобретается множество ухищрений, например учет того факта, что SNP, расположенные близко друг к другу на хромосоме, коррелируют.
« Наиболее прогностической полигенной оценкой на данный момент является рост, который объясняет 17% вариаций роста взрослых » Архитектура роста взрослого человека», Nature Genetics, 46 (2014): 1173-86. doi: 10.1038/ng.3097. На главные ассоциации SNP для роста приходится в среднем 0,07% дисперсии, что соответствует эффекту 0,05 см.
« Этот разрыв [между предсказанием признака по полигенной шкале и наследуемостью признака] называется отсутствующей наследственностью» : Брендан Махер, «Персональные геномы: случай отсутствующей наследственности», Nature , 456 (2008): 18–21. . дои: 10.1038/456018a . Отсутствие наследуемости является ключевой проблемой для всех сложных признаков в науках о жизни .
Отсутствие наследственности называют «темной материей» полногеномной ассоциации, потому что, хотя она определенно существует, мы не можем ее увидеть. Этот недостающий разрыв в наследуемости будет сокращаться по мере того, как исследования GWA будут расширяться и улучшаться. Используя современные технологии, мы должны быть в состоянии более чем удвоить прогностическую силу полигенных оценок с большими выборками GWA. Еще одна причина для оптимизма заключается в том, что чипы SNP, используемые в исследованиях GWA, в основном включают общие SNP, но большинство различий ДНК не являются общими. Было подсчитано, что современные чипы SNP составляют лишь около половины всей генетической изменчивости генома. Тери А. Манолио и др., «Поиск недостающей наследственности комплексного заболевания», Nature , 461 (2009): 747-53. дои: 10.1038/nature08494. Фрэнк Дадбридж, «Мощность и точность прогнозирования показателей полигенного риска», PLoS Genetics , 9 (2013): doi: 10.1371/journal.pgen.1003348.
Поскольку полногеномное секвенирование фиксирует все унаследованные различия ДНК, а не только общие SNP, оно может удвоить прогностическую силу полигенных оценок. Этот вывод подтверждается новым методом оценки наследуемости, называемым наследуемостью SNP , поскольку он основан на прямом измерении SNP ДНК. Наследуемость SNP оценивает корреляцию между SNP и сходством признаков для неродственных людей среди сотен тысяч SNP на чипе SNP. Хотя в настоящее время существует несколько способов оценки наследуемости SNP, первый метод назывался Анализ комплексных признаков всего генома ( GCTA ): Jian Yang et al., 'Common SNPs Explain a Large Proportion of the Heritability for Human Height', Nature Genetics , 42 (2010): 565-9. doi: 10.1038/ng.608. Цзянь Ян и др., «Разделение генома генетической изменчивости для сложных признаков с использованием