ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 09.11.2023
Просмотров: 3146
Скачиваний: 364
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
P. Они рассматривают несколько генов, несколько психологических черт или несколько способов анализа данных, но сообщают только те результаты, которые лучше всего рассказывают историю. Легко стать жертвой этого типа мошенничества, потому что мы все хотим рассказывать хорошие истории, и это вызывает искушение замести осложнения под ковер. Для публикации хорошей истории требуется, чтобы результаты соответствовали общепринятому 5-процентному значению P. Но погоня за этим значением P означает, что законы P (вероятности) нарушены. Погоня заканчивается тем, что выявляются только ложноположительные результаты.
Нет ничего плохого в том, чтобы попытаться рассказать хорошую историю, если она правдива. Проблема с сотнями историй о генах-кандидатах в том, что они не соответствовали действительности, но привели к сотням сообщений в СМИ о «гене интеллекта» или «гене шизофрении». Хотя исследования генов-кандидатов продолжают публиковаться и сегодня, большинство журналов теперь требуют, чтобы статьи, сообщающие об ассоциациях генов-кандидатов, перед публикацией включали доказательства репликации в независимых образцах. Ложноположительные результаты не повторяются. Сотни отчетов об ассоциациях генов-кандидатов с интеллектом и шизофренией не подтвердились.
Боль от этого фальстарта исследований генов-кандидатов была смягчена успехом нового подхода, появившегося на рубеже веков, когда стало ясно, что исследования генов-кандидатов потерпели неудачу. Новым подходом была полногеномная ассоциация (GWA), которая противоположна подходу гена-кандидата.
« Мечта заключалась в том, чтобы систематически искать по всему геному, а не выбирать несколько произвольно выбранных генов-кандидатов»
: Neil Risch and Kathleen Merikangas, «The Future of Genetic Studies of Complex Human Diseases», Science, 273 (1996): 1516-17 . doi: 10.1126/наука.
273.5281.1516 . Я не описывал более старый подход к поиску генов в геноме, называемый анализом сцепления. Как и полногеномная ассоциация, сцепление представляет собой систематическую полногеномную стратегию охоты за генами. Он использует всего несколько сотен ДНК-маркеров в геноме для определения хромосомной локализации основных эффектов генов путем изучения косегрегации в семейных родословных между ДНК-маркером и заболеванием. Однако сцепление недостаточно эффективно для обнаружения меньших эффектов генов. Сцепление может указывать на хромосомное соседство, но не может указать точное местоположение. Я решил не обсуждать сцепление, так как сейчас оно редко используется, потому что оно способно обнаруживать только эффекты основных генов, в то время как большинство эффектов крошечные.
« В 1998 году я решил провести скрининг генома, генотипируя различия ДНК одно за другим, чтобы найти различия ДНК, связанные с интеллектом» : Роберт Пломин и др., «Полногеномное сканирование 1842 ДНК-маркеров для
Аллельные ассоциации с общей когнитивной способностью: пятиэтапный дизайн с использованием объединения ДНК и экстремально выбранных групп, Behavior Genetics , 31 (2001): 497-509. дои: 10.1023/A:1013385125887. Я сократил затраты времени и денег, объединив ДНК для групп людей, а не генотипируя каждого человека отдельно. Это называется объединением ДНК ; генотипирование 100 особей стоит не больше, чем генотипирование одной особи, потому что вы объединяете ДНК 100 особей и генотипируете объединенную ДНК: Lee M. Butcher et al., 'Genotyping Pooled DNA on Microarrays: A Systematic Genome Screen of Thousands of SNPs in Большие выборки для обнаружения QTL для комплексных признаков»,
Behavior Genetics , 34 (2004): 549-55. doi: 10.1023/b%3abege.0000038493.26202.d3.
Я сравнил группы из 100 человек с высоким интеллектом и 100 человек со средним интеллектом. Люди с высоким интеллектом пришли из двух источников. Половина была отобрана из более крупной выборки в Кливленде, штат Огайо, с оценкой IQ выше 130. Другая половина была получена из американского исследования, в котором были отобраны подростки с оценкой IQ выше 160. Контрольная выборка людей со средним IQ была получена из того же Кливленда. Выборка, выбирающая детей с IQ от 90 до 110.
Вторым коротким путем было использование типа ДНК-маркера со многими аллелями, потому что такие маркеры гораздо более информативны, чем SNP, которые имеют только два аллеля. Простые повторы последовательностей (SSR) содержат множество аллелей, содержащих последовательность из двух-пяти пар оснований, которая по неизвестным причинам повторяется от пяти до пятидесяти раз. Количество повторов передается по наследству. В геноме человека есть десятки тысяч SSR, в основном в некодирующих областях. SSR используются при снятии отпечатков пальцев ДНК, что произвело революцию в судебно-медицинской экспертизе, позволив создавать уникальные профили ДНК для отдельных лиц, «отпечатки пальцев» ДНК. Мы генотипировали 2000 SSR, равномерно распределенных по всему геному, используя пятиэтапную схему репликации, которая отсеяла ложноположительные результаты. 2000 SSR не могли охватить каждый бит генома, но они могли сканировать большую его часть.
SNP вызвали взрыв полногеномных ассоциативных исследований» : Джоэл Хиршхорн и Марк Дж. Дейли, «Полногеномные ассоциативные исследования общих болезней и сложных признаков», Nature Reviews Genetics , 6 (2005): 95-108. дои: 10.1038/nrg1521.
' результаты
[ моего исследования GWA об интеллекте с использованием SNP-чипов ] были очень разочаровывающими» : Lee M. Butcher et al., «SNP, Microarrays and Pooled DNA: Identification of Four Loci Associated with Light Mental Disairment in the Sample of 6000 Children», Human Молекулярная генетика , 14 (2005): 1315-25. дои: 10.1093/hmg/ddi142. Мы провели еще один
Исследование GWA с использованием нового чипа SNP с 500 000 SNP, но дало такие же разочаровывающие результаты: Lee M. Butcher et al., «Количественное сканирование ассоциации локуса признаков по всему геному общих когнитивных способностей с использованием объединенной ДНК и 500 000 SNP (одиночный нуклеотидный полиморфизм) Microarrays', Genes, Brain and Behavior, 7 (2008): 435-46. doi: 10.1111/j.1601-183X.2007.00368.x. Основные ассоциации SNP из этих исследований не воспроизводились: Michelle Luciano et al., «Тестирование репликации набора из 5 SNP для общих когнитивных способностей в шести выборках населения», European Journal of Human Genetics , 16 (2008): 1388-95. . doi: 10.1038/ejhg.2008.100.
« Это означало, что размеры выборки исчислялись не сотнями или даже тысячами, а десятками тысяч» . Проблема усугублялась тем, что исследования ассоциаций всего генома проверяют сотни тысяч SNP по всему геному. В качестве чрезвычайно консервативной поправки на множественное тестирование стало общепринятым делать поправку на 1 миллион тестов в полногеномных ассоциативных исследованиях. Это означало использование значения P не 5 процентов, не 0,5 процента, а 0,00000005. Необходима выборка из 50 000 человек, чтобы иметь достаточную мощность для обнаружения ассоциаций с такой количественной характеристикой, как интеллект, в этих условиях, которые казались невероятно большими для психологических исследований. Хуже того, такой размер выборки необходим для того, чтобы скользить по поверхности, чтобы обнаружить только самые большие эффекты. Чтобы зафиксировать больше различий ДНК, ответственных за наследуемость, потребуются сотни тысяч образцов.
В 2007 году было опубликовано исследование GWA , в котором сообщалось об анализе 2000 случаев для каждого из семи основных заболеваний» : Консорциум по контролю за случаями Wellcome Trust, «Полногеномное ассоциативное исследование 14 000 случаев семи распространенных заболеваний и 3000 общих контролей», Nature , 447 (2007): 661-78. дои: 10.1038/природа05911.
' Консорциум по контролю за случаями Wellcome Trust ... единственное психологическое расстройство, биполярное расстройство, не показало твердых ассоциаций SNP' : одна ассоциация SNP не была значимой при тестировании с использованием обычной «аддитивной» модели, в которой риск увеличивается аддитивно, когда люди имеют один или два аллеля риска. Связь была значимой только при тестировании неаддитивной (рецессивной) модели, в которой один аллель риска не оказывает влияния — эффект материализуется только тогда, когда у человека есть два аллеля риска. Тестирование альтернативных моделей разумно, но сопряжено с риском «погони за значениями P», что, как в данном случае, может привести к невозможности воспроизведения.
« К 2011 году придирки настолько плохо, что девяносто шесть ведущих исследователей GWA сочли необходимым опубликовать письмо под заголовком «Не отказывайтесь от GWAS» : Патрик Салливан, «Не отказывайтесь от GWAS», Molecular Psychiatry , 17 (2011) : 2-3. doi: 10.1038/mp.2011.94.
« За эти пять лет был достигнут большой прогресс : от двадцати четырех значимых ассоциаций для семи признаков из исследования Wellcome Trust до более чем 2000 ассоциаций SNP для более чем 200 признаков»:
Нет ничего плохого в том, чтобы попытаться рассказать хорошую историю, если она правдива. Проблема с сотнями историй о генах-кандидатах в том, что они не соответствовали действительности, но привели к сотням сообщений в СМИ о «гене интеллекта» или «гене шизофрении». Хотя исследования генов-кандидатов продолжают публиковаться и сегодня, большинство журналов теперь требуют, чтобы статьи, сообщающие об ассоциациях генов-кандидатов, перед публикацией включали доказательства репликации в независимых образцах. Ложноположительные результаты не повторяются. Сотни отчетов об ассоциациях генов-кандидатов с интеллектом и шизофренией не подтвердились.
Боль от этого фальстарта исследований генов-кандидатов была смягчена успехом нового подхода, появившегося на рубеже веков, когда стало ясно, что исследования генов-кандидатов потерпели неудачу. Новым подходом была полногеномная ассоциация (GWA), которая противоположна подходу гена-кандидата.
« Мечта заключалась в том, чтобы систематически искать по всему геному, а не выбирать несколько произвольно выбранных генов-кандидатов»
: Neil Risch and Kathleen Merikangas, «The Future of Genetic Studies of Complex Human Diseases», Science, 273 (1996): 1516-17 . doi: 10.1126/наука.
273.5281.1516 . Я не описывал более старый подход к поиску генов в геноме, называемый анализом сцепления. Как и полногеномная ассоциация, сцепление представляет собой систематическую полногеномную стратегию охоты за генами. Он использует всего несколько сотен ДНК-маркеров в геноме для определения хромосомной локализации основных эффектов генов путем изучения косегрегации в семейных родословных между ДНК-маркером и заболеванием. Однако сцепление недостаточно эффективно для обнаружения меньших эффектов генов. Сцепление может указывать на хромосомное соседство, но не может указать точное местоположение. Я решил не обсуждать сцепление, так как сейчас оно редко используется, потому что оно способно обнаруживать только эффекты основных генов, в то время как большинство эффектов крошечные.
« В 1998 году я решил провести скрининг генома, генотипируя различия ДНК одно за другим, чтобы найти различия ДНК, связанные с интеллектом» : Роберт Пломин и др., «Полногеномное сканирование 1842 ДНК-маркеров для
Аллельные ассоциации с общей когнитивной способностью: пятиэтапный дизайн с использованием объединения ДНК и экстремально выбранных групп, Behavior Genetics , 31 (2001): 497-509. дои: 10.1023/A:1013385125887. Я сократил затраты времени и денег, объединив ДНК для групп людей, а не генотипируя каждого человека отдельно. Это называется объединением ДНК ; генотипирование 100 особей стоит не больше, чем генотипирование одной особи, потому что вы объединяете ДНК 100 особей и генотипируете объединенную ДНК: Lee M. Butcher et al., 'Genotyping Pooled DNA on Microarrays: A Systematic Genome Screen of Thousands of SNPs in Большие выборки для обнаружения QTL для комплексных признаков»,
Behavior Genetics , 34 (2004): 549-55. doi: 10.1023/b%3abege.0000038493.26202.d3.
Я сравнил группы из 100 человек с высоким интеллектом и 100 человек со средним интеллектом. Люди с высоким интеллектом пришли из двух источников. Половина была отобрана из более крупной выборки в Кливленде, штат Огайо, с оценкой IQ выше 130. Другая половина была получена из американского исследования, в котором были отобраны подростки с оценкой IQ выше 160. Контрольная выборка людей со средним IQ была получена из того же Кливленда. Выборка, выбирающая детей с IQ от 90 до 110.
Вторым коротким путем было использование типа ДНК-маркера со многими аллелями, потому что такие маркеры гораздо более информативны, чем SNP, которые имеют только два аллеля. Простые повторы последовательностей (SSR) содержат множество аллелей, содержащих последовательность из двух-пяти пар оснований, которая по неизвестным причинам повторяется от пяти до пятидесяти раз. Количество повторов передается по наследству. В геноме человека есть десятки тысяч SSR, в основном в некодирующих областях. SSR используются при снятии отпечатков пальцев ДНК, что произвело революцию в судебно-медицинской экспертизе, позволив создавать уникальные профили ДНК для отдельных лиц, «отпечатки пальцев» ДНК. Мы генотипировали 2000 SSR, равномерно распределенных по всему геному, используя пятиэтапную схему репликации, которая отсеяла ложноположительные результаты. 2000 SSR не могли охватить каждый бит генома, но они могли сканировать большую его часть.
SNP вызвали взрыв полногеномных ассоциативных исследований» : Джоэл Хиршхорн и Марк Дж. Дейли, «Полногеномные ассоциативные исследования общих болезней и сложных признаков», Nature Reviews Genetics , 6 (2005): 95-108. дои: 10.1038/nrg1521.
' результаты
[ моего исследования GWA об интеллекте с использованием SNP-чипов ] были очень разочаровывающими» : Lee M. Butcher et al., «SNP, Microarrays and Pooled DNA: Identification of Four Loci Associated with Light Mental Disairment in the Sample of 6000 Children», Human Молекулярная генетика , 14 (2005): 1315-25. дои: 10.1093/hmg/ddi142. Мы провели еще один
Исследование GWA с использованием нового чипа SNP с 500 000 SNP, но дало такие же разочаровывающие результаты: Lee M. Butcher et al., «Количественное сканирование ассоциации локуса признаков по всему геному общих когнитивных способностей с использованием объединенной ДНК и 500 000 SNP (одиночный нуклеотидный полиморфизм) Microarrays', Genes, Brain and Behavior, 7 (2008): 435-46. doi: 10.1111/j.1601-183X.2007.00368.x. Основные ассоциации SNP из этих исследований не воспроизводились: Michelle Luciano et al., «Тестирование репликации набора из 5 SNP для общих когнитивных способностей в шести выборках населения», European Journal of Human Genetics , 16 (2008): 1388-95. . doi: 10.1038/ejhg.2008.100.
« Это означало, что размеры выборки исчислялись не сотнями или даже тысячами, а десятками тысяч» . Проблема усугублялась тем, что исследования ассоциаций всего генома проверяют сотни тысяч SNP по всему геному. В качестве чрезвычайно консервативной поправки на множественное тестирование стало общепринятым делать поправку на 1 миллион тестов в полногеномных ассоциативных исследованиях. Это означало использование значения P не 5 процентов, не 0,5 процента, а 0,00000005. Необходима выборка из 50 000 человек, чтобы иметь достаточную мощность для обнаружения ассоциаций с такой количественной характеристикой, как интеллект, в этих условиях, которые казались невероятно большими для психологических исследований. Хуже того, такой размер выборки необходим для того, чтобы скользить по поверхности, чтобы обнаружить только самые большие эффекты. Чтобы зафиксировать больше различий ДНК, ответственных за наследуемость, потребуются сотни тысяч образцов.
В 2007 году было опубликовано исследование GWA , в котором сообщалось об анализе 2000 случаев для каждого из семи основных заболеваний» : Консорциум по контролю за случаями Wellcome Trust, «Полногеномное ассоциативное исследование 14 000 случаев семи распространенных заболеваний и 3000 общих контролей», Nature , 447 (2007): 661-78. дои: 10.1038/природа05911.
' Консорциум по контролю за случаями Wellcome Trust ... единственное психологическое расстройство, биполярное расстройство, не показало твердых ассоциаций SNP' : одна ассоциация SNP не была значимой при тестировании с использованием обычной «аддитивной» модели, в которой риск увеличивается аддитивно, когда люди имеют один или два аллеля риска. Связь была значимой только при тестировании неаддитивной (рецессивной) модели, в которой один аллель риска не оказывает влияния — эффект материализуется только тогда, когда у человека есть два аллеля риска. Тестирование альтернативных моделей разумно, но сопряжено с риском «погони за значениями P», что, как в данном случае, может привести к невозможности воспроизведения.
« К 2011 году придирки настолько плохо, что девяносто шесть ведущих исследователей GWA сочли необходимым опубликовать письмо под заголовком «Не отказывайтесь от GWAS» : Патрик Салливан, «Не отказывайтесь от GWAS», Molecular Psychiatry , 17 (2011) : 2-3. doi: 10.1038/mp.2011.94.
« За эти пять лет был достигнут большой прогресс : от двадцати четырех значимых ассоциаций для семи признаков из исследования Wellcome Trust до более чем 2000 ассоциаций SNP для более чем 200 признаков»: