Файл: Исследование (gwas) агрономических признаков и содержания фенолов в генотипах сорго (Sorghum bicolor. L).pdf

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 09.12.2023

Просмотров: 46

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Таблица 2. Сводка агрономических признаков 96 генотипов сорго, использованных в этом исследовании.
1
HD, дата заголовка; PH, высота растения; SC, содержание твердых веществ;
DY, сухой выход.
3.2. Анализ UPLC в генотипах сорго
Общее содержание фенолов (TPC) в линиях сорго показано в таблице 1.
Подробная информация о шести фенольных соединениях представлена в таблице S2. Хроматограммы УЭЖХ выявили наличие шести пиков (рис. 1).
Было выделено шесть фенольных компонентов: диглюкозид лютеолинидина, глюкозид лютеолина, глюкозид апигенинидина, лютеолинидин, апигенинидин и 5-O-Me-лютеолинидин. Шесть типов содержания фенолов представляли собой диглюкозид лютеолинидина, в диапазоне от 0,09 (Икумба, рис. 2А) до 0,46 мг/100 г (Банволданг, рис. 2Н), в среднем 0,23 мг/100 г.
Глюкозиды лютеолина варьировали от 0,00 (Сорго-медовое и др., рис. 2Б) до
1,24 мг/100 г (Пахат-5, рис. 2И), в среднем 0,30 мг/100 г. Диапазон глюкозида апигенинидина был от 0,02 (Dansusu2-10, рисунок 2C) до 1,18 мг/100 г (Bitjaru, рисунок 2J), в среднем 0,40 мг/100 г. Лютеолинидин варьировался от 0,06
(Пахат-4, рис. 2D) до 5,20 мг/100 г (горно-сладкий, рис. 2K), в среднем 1,64 мг/100 г. Диапазон апигенинидина был от 0,00 (Dansusu2-12, рис. 2E) до 0,75 мг (Bitjaru, рис. 2L), в среднем 0,32 мг/100 г. 5-O-Me-лютеолинидин варьировался от 0,01 (Dansusu2-12, рис. 2F) до 0,43 мг/100 г (горно-сладкий, рис. 2M), в среднем 0,21 мг/100 г. Общее содержание фенолов колебалось от
1,92 (Пахат-4, рис. 2G) до 13,10 мг/100 г (IS645-2, рис. 2N), в среднем 6,37 мг/100 г. IS645-2 увеличил TPC на 6,43 мг/100 г по сравнению с исходным сортом (рис. 1). Лютеолинидин составлял наибольшую долю (26,8%) TPC.

Фенольные соединения показали непрерывные вариации с нормальным распределением в соответствии с асимметрией и эксцессом (таблица 3).

Рисунок 1. Профили фенольных соединений с помощью ультраэффективной жидкостной хроматографии (UPLC) были обнаружены при 320 нм для самой высокой линии TPC и их исходного сорта в сорго. (A) IS645, исходный сорт;
(Б) ИС645-2; 1 диглюкозид лютеолинидина; 2 лютеолин глюкозид; 3 апигенинидин глюкозид; 4 лютеолинидин; 5 апигенинидин, 6 5-O-Me- лютеолинидин.
Рисунок 2. Трехмерные профили фенольных соединений с помощью ультраэффективной жидкостной хроматографии (UPLC). Верхняя цифра — это минимальное значение идентификации, а нижняя цифра — максимальное значение идентификации. (А) Икумба. (Б) Сорго-медовое и др. (В) Дансусу2-
10. (Г) Пахат-4. (Э) Дансусу2-12. (F) Дансусу2-12. (Г) Пахат-4. (H) Банволданг.
(I) Пахат-5. (Дж) Битжару. (K) Горно-сладкий. (Л) Битжару. (M) Горно- сладкий. (Н) IS645.

Таблица 3. Сводка общего содержания фенолов и шести фенольных соединений в 96 генотипах 223 сорго, использованных в этом исследовании
3.3. Корреляционный анализ
Чтобы сравнить корреляцию между агрономическими и фитохимическими признаками, мы проанализировали коэффициент парной корреляции Пирсона между четырьмя агрономическими признаками (HD, PH,
SC и DY) и фитохимическими соединениями (TPC, лютеолинидин диглюкозид, лютеолин глюкозид, апигенидин глюкозид, лютеолинидин, апигенинидин и 5-O-Me-лютеолинидин) в 96 линиях сорго (рис. 3). Сильные положительные корреляции были показаны между PH и DY (r = 0,60, P
<0,001), HD и PH (r = 0,40, P <0,001). Слабые положительные корреляции были показаны между SC и DY (r = 0,23, P < 0,01). При сравнении корреляций между
TPC и шестью фенольными соединениями они в целом показали положительную корреляцию, за исключением корреляций между глюкозидом лютеолина и диглюкозидом лютеолинидина. Сильные положительные корреляции наблюдались между ТФХ и лютеолинидином (r = 0,82, P <0,001), апигенинидин-глюкозидом и апигенинидином (r = 0,79, P <0,001) и лютеолинидином и апигенинидином (r = 0,75, P <0,001). Диглюкозид лютеолинидина отрицательно коррелировал с ЛГ (r = -0,37, P <0,001) и HD (r
= -0,36, P <0,001).

Рисунок 3. Корреляционный анализ между отдельными агрономическими признаками и фенольными соединениями. HD (дата заголовка); РН (высота растения); СК (содержание растворимых твердых веществ); DY (сухой выход);
TPC (общее содержание фенолов). *, ** и *** значимы при уровнях вероятности 0,05, 0,01 и 0,001 соответственно.
3.4. Генотипирование путем секвенирования генотипов сорго
Библиотека GBS была создана из 37 генетических ресурсов и 59 мутантных линий сорго, которые были секвенированы с использованием платформы Illumina HiSeq X Ten. Сводка этих результатов секвенирования представлена в таблице 4. Всего было сгенерировано 684 миллиона ридов, содержащих 103 348 422 063 нуклеотида (103,3 Гб), в среднем 7,1 млн ридов


(1,0 Гб) на генотип. После удаления некачественных последовательностей осталось 620 196 808 чистых прочтений, в среднем 6,4 миллиона прочтений на генотип. Общий диапазон чистых чтений составлял от 98,4 МБ до 2818,9 МБ, при этом средняя длина чтения составляла 673,3 МБ. Общее количество сопоставленных прочтений составило 599 168 188 во всех строках, в среднем
6 241 335 прочтений на образец. Сопоставленные показатели чтения (%) варьировались от 91,76% до 97,84%. В среднем 96,69% отфильтрованных прочтений были сопоставлены с эталонной последовательностью генома.
Общая длина картируемой области составила 4968,2 Мб, в среднем 51,7 Мб на образец, что покрывает примерно 7,09% последовательности эталонного генома. Среди 96 линий средняя глубина закартированной области колебалась от 4,00 до 16,37 (таблица S1).
Таблица 4. Сводка данных последовательности GBS и сопоставление с эталонной последовательностью генома.
Mapped reads on reference genome
1 1
Справочный геном; Сорго двухцветное Рио _v2.
3.5. Идентификация SNP
SNP для каждой линии были выбраны из отфильтрованных SNP в положении матрицы между линиями сорго и эталонной последовательностью
генома (таблица S3). В общей сложности 10 369 812 SNP варьировались от 22 737 (IS2868-1) до 201 950 SNP (IS14131), в среднем 108 019 SNP. В общей сложности 192 040 SNP были идентифицированы в генотипах 96 линий сорго с использованием подхода GBS (таблица 5). Длина хромосом колебалась от 60 миллионов (хромосома 9) до 89 миллионов (хромосома 2). Количество SNP варьировало от 13 830 (хромосома 7) до 25 265 (хромосома 1). Самая высокая плотность SNP наблюдалась на хромосоме 1 с 310,0 маркерами SNP на 1 Мб, тогда как наименьшая плотность была на хромосоме 7 с 196,8 маркеров SNP на 1 Мб. Средняя плотность составила 246,7 маркеров на 1 Мб. Самая высокая частота SNP наблюдалась на хромосоме 7 с 5,08 т.п.н. на SNP, тогда как самая низкая частота была на хромосоме 1 с 3,23 т.п.н. на SNP. Средняя частота составила 5,06 т.п.н. на SNP. SNP в линиях сорго были функционально аннотированы с использованием эталонной последовательности генома.
Большинство SNP (82 279; 42,84%) находились в генных регионах, но несколько — в межгенных регионах (109 761; 57,16%). По области гена распределение SNP в экзоне, CDS (35 499; 43,14%), интронах (31 041; 274 37,73%), экзоне (14 727; 17,90%), экзоне и интроне (517; 0,63%), и определяли экзон, CDS и интрон (495; 0,60%) (таблица S4).
Таблица 5. Хромосомное распределение и частота SNP, идентифицированных с использованием подхода GBS в 96 генотипах сорго.

3.6. GWAS-анализ агрономических признаков
В общей сложности 34 значимых SNP (-log10(p) > 4,0) были обнаружены в трех агрономических признаках (HD, PH и DY) для 96 генотипов сорго с использованием GWAS-анализа комбинированного набора данных GBS
(таблица S5). В СК не выявлено значимого SNP со значением -log10(p) более
4,0. Из 34 значимых SNP девять SNP (HD, четыре SNP, PH, три SNP и DY, два
SNP) были обнаружены совместно более чем в двух моделях (таблица 6, рисунок S1). Мы аннотировали важные SNP в HD, PH и DY. Четыре SNP для
HD (-Log10 (P) = 4,15-4,93), которые были расположены в экзоне и CD на хромосомах 2, 6 и 10 были SB02_6876523, SB02_6876524 (SBRIO.02G064100;
Benzyl Altugle Obenzoyltrasferase), SB06_87054 .06G036000; изоформа X2, подобная эндо-1,4-бета-ксиланазе 4), и Sb10_7471984 (SbRio.10G099600; изоформа X2, подобная галактозид2-альфа-L-фукозилтрансферазе). 3 SNP для
PH (-log10(p) = 4,12 – 11,70) располагались в экзоне и CDS на хромосомах 7, 8 и 9: Sb07_53523852 (SbRio.07G123800; nudix hydrolase 15, митохондриальная),
Sb08_63291752
(SbRio.08G1).
41500; гипотетический белок
BDA96_08G141500) и Sb09_50399847 (SbRio.09G149200; гипотетический белок BDA96_09G149200). Два SNP для DY (-293 log10(p) = 4,20–6,82) были расположены в интроне, экзоне и CDS на хромосомах 4 и 8; 294 Sb04_2143594
(SbRio.04G031300; бета-амилаза 8 изоформа X2) и Sb06_62687750
(SbRio.06G211400; транскрипционный фактор MafB). Из девяти SNP, связанных с агрономическими признаками, Sb10_7471984 был единственным, обнаруженным совместно во всех четырех моделях GWAS. Влияние аллеля оценивали по SNP-маркеру с наименьшим p-значением для каждого агрономического признака.
Ассоциированный с
БХ
SNP-маркер
Sb10_7471984 на хромосоме 10 имел аллели A/G, а средний БХ для лиц с аллелями GG составлял 84 дня, что на 15 дней короче, чем средний БХ для лиц с аллелями АА (99 дней). PH-ассоциированный SNP-маркер Sb09_50399847 на хромосоме 9 имел аллели G/A, а средний PH для лиц с аллелями AA составил
305 см, что на 134 см больше, чем средний PH для лиц с аллелями GG (171 см).


. Ассоциированный с DY SNP-маркер Sb04_2143594 304 на хромосоме 4 имел аллели G/C, а средняя DY для особей с аллелями СС составила 11,60 т/га, что на 7,58 т/га легче, чем средняя DY для особей с аллелями GG. (19,18 т/га) (рис.
4).
Таблица 6. Информация о совместно обнаруженных SNP для агрономических признаков (HD, PH и DY) по результатам GWAS.
1 HD (дата заголовка); РН (высота растения); DY (сухой выход); 2 MAF
(минорная частота аллеля); 3 Метод 1–4 относится к BLINK (1); ЦП фермы (2);
МЛММ (3); МЛМ (4); 4 Эталонный геном; Сорго двухцветное Рио _v.2.1.
Рис. 4. Фенотипические различия между линиями с разными аллелями (слева
— эталонный геном; справа — альтернативный геном) по SNP, связанным с датой колошения (HD); высота растения (PH); сухой выход (DY). *, ** и *** значимы при уровнях вероятности 0,05, 0,01 и 0,001 соответственно.

3.7. GWAS-анализ общего содержания фенолов
Всего было обнаружено 117 значимых SNP (-log10(p) > 4,0) в TPC и 6 фенольных соединениях (лютеолинидин диглюкозид, лютеолин глюкозид, апигенидин глюкозид, лютеолинидин, апигенинидин и
5-O-Me лютеолинидин) для 96 генотипов сорго. с использованием анализа GWAS комбинированного набора данных GBS (таблица S6). Из 117 значимых SNP 31
SNP (TPC; шесть SNP, лютеолинидин диглюкозид; восемь SNP, лютеолин глюкозид; четыре SNP, апигенидин глюкозид; восемь SNP, лютеолинидин; три SNP; и 5-O-Me лютеолинидин; два SNP). - обнаружен более чем в двух моделях и включает два фенольных соединения (таблица 7, рисунок S1). Мы аннотировали важные SNP TPC и пяти фенольных соединений. В случае апигенинидина SNP не были идентифицированы как обнаруженные совместно более чем в двух моделях. Три SNP для TPC (-log10(p) = 4,03 – 14,04) были расположены в интроне, экзоне и CDS на хромосомах 2 и 4: Sb02_81797062
(SbRio.02G343600; рецептор этилена 4), Sb04_1305322 (SbRio.04G019000; холин/ этаноламинфосфотрансфераза 1) и Sb04_64461978 (SbRio.04G361300; белок семейства гликозилтрансфераз 2). 7 SNP для диглюкозида лютеолинидина (-log10(p)= 4,04–22,41) были расположены в интроне, экзоне и CDS на хромосомах 2, 4 и 6: Sb02_79905727 (SbRio.02G316600; NEP1- взаимодействующий белок, подобный 1), Sb04_59016630 (SbRio.04G289300; белковоподобная изоформа X1, богатая глутаминовой кислотой) и
Sb06_59065337,
Sb06_59065351,
Sb06_59065380,
Sb06_59065407
(SbRio.06G167800; ассоциированный со стенкой рецептор киназа 4). Четыре
SNP для глюкозида лютеолина (-log10(p) = 4,01–4,27) были расположены в экзоне и CDS на хромосомах 1, 3 и 5; Sb01_14431763 (SbRio.01G175100; белок суперсемейства повторов ARM, кальций-транспортирующая АТФаза 3; типа плазматической мембраны);
Sb03_4939603
(SbRio.03G056200; гипотетический белок BDA96_03G056200) и Sb05_9038134, Sb05_9038126
(SbRio.05G076500; вероятная киназа CHARK). Восемь SNP для глюкозида апигенинидина (-log10(p) = 4,08–11,40) были расположены в интроне, экзоне

и CDS на хромосомах 1, 3, 6 и 10; Sb01_1229036, Sb01_1229046
(SbRio.01G011000; малый ядерный рибонуклеопротеин A' U2), Sb03_68395304
(SbRio.03G375900; ruvB-подобный белок 1), Sb03_68358847, Sb03_6835881 5, и Sb03_68358771 (SbRio.03G375100; белок GPR107), Sb06_55785073
(SbRio.06G125400; белок устойчивости к болезням Pik-1) и Sb10_4609482
(SbRio.10G064200; протеасомная субъединица альфа типа-4-2). Один SNP для лютеолинидина (-log10(p) = 4,23–4,98) располагался в экзоне на хромосоме 2;
Sb02_81797139 (SbRio.02G343600; рецептор 4 этилена). Два 347 SNP для 5-O-
Me лютеолинидина (-log10(p) = 4,23–7,23) были расположены в интроне, экзоне и CDS на хромосомах 6 и 8: Sb06_68347889 (SbRio.06G295300; множественный РНК-связывающий домен, содержащий белок 1) и
Sb08_65531987 (SbRio.08G160200; Os04g0380500). Примечательно, что в общей сложности было идентифицировано четыре SNP, которые вносят вклад в два фенольных соединения, три из которых вносят вклад в TPC и лютеолинидин, а один - в TPC и диглюкозид лютеолинидина (таблица S6). SNP
Sb02_81796960, Sb02_81797062 и Sb02_81797139, которые вносят вклад одновременно в TPC и лютеолинидин, были расположены на 81 796 960–81 797 139 п.н. и кодируют гены-кандидаты SbRio.02G343600, которые функционируют как рецептор этилена 4. SNP Sb0 4_56584914, которые вносят вклад одновременно в TPC и диглюкозид лютеолинидина. расположен на 56 584 914 п.н. и кодирует гены-кандидаты SbRio.04G259800, которые функционируют как субъединица альфа-1 компонента пируватдегидрогеназы
E1, митохондриальная. Эффекты аллелей были оценены для SNP-маркеров, при этом самые низкие p-значения были получены для SNP, задействованных в двух соединениях. SNP-маркер Sb04_56584914, ассоциированный с лютеолинидиндиглюкозидом, на хромосоме 4 имел аллели C/G, а средние значения ТФС и лютеолинидиндиглюкозида для лиц с аллелями GG составляли 5,98 и 0,21 мг/100 г, что составляло 3,46 и 0,11 мг/100 г. ниже, чем средние ТФХ и лютеолинидин диглюкозида для лиц с аллелями СС (ТФХ; 9,44 мг/100 г, лютеолинидин диглюкозида; 0,32 мг/100 г) соответственно. ТФХ и
связанный с лютеолидином SNP-маркер Sb02_81797062 на хромосоме 2 имели аллели A/G, а средние ТФХ и лютеолинидин для лиц с аллелями GG составляли 5,82 и 1,38 мг/100 г, что было на 1,30 и 0,54 мг/100 г ниже, чем у лиц с аллелями GG. средние ТФХ и лютеолинидин для лиц с аллелями АА
(ТФХ; 7,12 мг/100 г, лютеолинидин, 1,92 мг/100 г) (рис. 5), соответственно, для аллелей АА.
Таблица 7. Информация об SNP, обнаруженных в двух или более моделях
GWAS или участвующих в двух или более соединениях для TPC и пяти фенольных соединениях (лютеолидиндиглюкозид, лютеолинглюкозид, апигенинидинглюкозид, лютеолинидин и 5-O-Me лютеолинидин) по результатам GWAS .

1 Признак 1–6 относится к ТПК (1); лютеолинидин диглюкозид (2); лютеолин глюкозид (3); апигенинидин глюкозид (4); лютеолинидин (5); 5-O-Me- лютеолинидин (6); 2 MAF (минорная частота аллеля); 3 Метод 1–4 относится к BLINK (1); ЦП фермы (2); МЛММ (3); МЛМ (4); 4 Эталонный геном; Сорго двухцветное Рио_v.2.1.
Рис. 5. Фенотипические различия между линиями с разными аллелями (слева
— эталонный геном; справа — альтернативный геном) по SNP, участвующим