Файл: С помощью библиотеки Sklearn на основе алгоритма cart производится построение дерева классификации с использованием стандартных параметров.docx
ВУЗ: Не указан
Категория: Не указан
Дисциплина: Не указана
Добавлен: 11.01.2024
Просмотров: 55
Скачиваний: 1
ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.
Содержимое файла data.csv:
,A1,A2,A3,A4,A5,A6,C
0,4.12,-0.12,0.11,-5.55,-6.89,6.32,1.0
1,-3.57,8.84,-5.75,7.65,-0.23,2.02,0.0
2,-1.63,-5.88,-5.69,6.98,7.98,-9.64,4.0
3,7.04,1.53,-0.56,-4.61,-5.6,-3.83,3.0
4,5.38,2.53,-0.13,-3.9,-3.7,-3.88,3.0
5,-2.5,-7.95,-9.22,8.13,9.7,-3.94,4.0
6,-6.72,9.72,-6.08,12.89,1.08,2.48,0.0
7,-1.99,-8.46,9.45,-1.24,2.43,-2.66,2.0
8,-6.23,7.21,-3.04,8.81,-2.85,0.86,0.0
9,7.35,2.49,-5.48,-6.68,-9.91,3.35,1.0
10,-2.51,-6.91,-6.81,4.51,11.65,-7.86,4.0
11,-1.91,-11.33,4.21,-3.91,-2.53,-5.59,2.0
12,4.43,-0.6,-3.08,-5.24,-6.8,5.11,1.0
13,-5.16,10.08,-6.04,11.5,-0.84,1.28,0.0
14,1.73,-5.62,6.85,-7.36,-5.28,-5.57,2.0
15,-3.64,-5.38,7.69,-5.49,-0.08,-4.64,2.0
16,-1.78,-6.54,-8.68,11.09,9.25,-6.71,4.0
17,-5.85,-9.17,8.51,-0.04,-4.68,-4.11,2.0
18,8.96,-0.49,-6.39,-9.04,-6.64,4.36,1.0
19,-3.97,6.15,-5.88,8.17,-0.34,2.73,0.0
20,7.6,-0.64,-4.22,-7.63,-9.57,6.35,1.0
21,4.07,4.52,5.48,-1.75,-1.88,-6.2,3.0
22,7.7,0.22,-9.78,-4.67,-12.14,7.85,1.0
23,1.97,-0.64,3.0,-6.1,-1.42,-4.04,3.0
24,-5.36,8.13,-5.33,10.96,2.05,3.22,0.0
25,-0.62,3.35,1.81,-4.79,-6.09,-7.53,3.0
26,-1.54,-8.39,-6.97,8.83,7.13,-6.58,4.0
27,3.0,2.29,0.86,-3.86,-5.33,-3.89,3.0
28,-3.06,-7.06,-4.82,9.7,8.47,-2.01,4.0
29,-6.43,9.36,-6.35,6.72,0.9,2.26,0.0
30,-4.68,-5.57,8.6,-2.48,-3.41,0.96,2.0
Ответ:
Отзыв
Правильный ответ: -9.91
Вопрос 9
Верно
Баллов: 1,0 из 1,0
Отметить вопрос
Текст вопроса
С использованием библиотеки Pandas проводится предварительный анализ данных, содержащихся в файле data.csv. Посредством анализа данных необходимо определить среднее значение параметра A5 для элементов списка, полученных путем отбора данных по условиям А2 > 0 и A3 < 1. Ответ требуется округлить с помощью функции round() до 2 знаков и записать через символ ".".
Содержимое файла data.csv:
,A1,A2,A3,A4,A5,A6,C
0,4.121,-0.118,0.113,-5.552,-6.894,6.323,1.0
1,-3.567,8.839,-5.747,7.646,-0.225,2.023,0.0
2,-1.628,-5.881,-5.689,6.976,7.984,-9.639,4.0
3,7.042,1.527,-0.561,-4.611,-5.599,-3.831,3.0
4,5.38,2.527,-0.131,-3.903,-3.695,-3.885,3.0
5,-2.496,-7.945,-9.216,8.132,9.704,-3.937,4.0
6,-6.715,9.719,-6.08,12.892,1.081,2.484,0.0
7,-1.989,-8.459,9.454,-1.238,2.432,-2.659,2.0
8,-6.233,7.213,-3.039,8.815,-2.853,0.856,0.0
9,7.355,2.491,-5.485,-6.676,-9.907,3.346,1.0
10,-2.513,-6.914,-6.806,4.505,11.649,-7.86,4.0
11,-1.911,-11.332,4.211,-3.911,-2.533,-5.588,2.0
12,4.427,-0.596,-3.077,-5.245,-6.8,5.11,1.0
13,-5.165,10.084,-6.039,11.495,-0.843,1.279,0.0
14,1.728,-5.62,6.847,-7.362,-5.278,-5.574,2.0
15,-3.639,-5.38,7.691,-5.493,-0.083,-4.641,2.0
16,-1.777,-6.542,-8.679,11.092,9.253,-6.712,4.0
17,-5.845,-9.168,8.514,-0.042,-4.678,-4.112,2.0
18,8.961,-0.486,-6.393,-9.04,-6.64,4.365,1.0
19,-3.974,6.152,-5.878,8.17,-0.336,2.733,0.0
20,7.601,-0.635,-4.222,-7.631,-9.572,6.345,1.0
21,4.07,4.523,5.475,-1.753,-1.882,-6.198,3.0
22,7.696,0.221,-9.783,-4.667,-12.141,7.846,1.0
23,1.974,-0.64,2.996,-6.096,-1.419,-4.042,3.0
24,-5.359,8.126,-5.326,10.956,2.047,3.224,0.0
25,-0.624,3.351,1.811,-4.795,-6.085,-7.53,3.0
26,-1.536,-8.394,-6.974,8.83,7.128,-6.575,4.0
27,2.997,2.29,0.864,-3.856,-5.327,-3.894,3.0
28,-3.06,-7.06,-4.823,9.703,8.469,-2.009,4.0
29,-6.432,9.359,-6.347,6.724,0.904,2.26,0.0
30,-4.681,-5.573,8.595,-2.482,-3.408,0.963,2.0
Ответ:
Отзыв
Правильный ответ: -3.07
Вопрос 10
Верно
Баллов: 1,0 из 1,0
Отметить вопрос
Текст вопроса
С использованием библиотеки Pandas осуществляется загрузка обучающей выборки данных из файла data.csv. Последний столбец в загруженных данных отвечает за метку класса (столбец "C"), остальные столбцы отвечают за атрибуты (столбцы "A1", "A2", "A3"). Загруженные данные используются для построения дерева классификации. При этом применяется библиотека Sklearn, а построение дерева осуществляется по алгоритму CART. Требуется определить условие разбиения данных в корневом узле. Примеры записи ответов: "A3 <= -1.625" или "A2 <= -6.359".
Содержимое файла data.csv:
,A1,A2,A3,C
0,6.466,5.892,-10.601,4.0
1,-6.026,2.403,-2.499,1.0
2,7.436,4.16,-14.177,4.0
3,2.756,2.602,3.526,2.0
4,2.783,-8.597,5.384,0.0
5,-4.133,-9.69,3.303,0.0
6,-1.794,1.75,7.927,2.0
7,2.346,0.936,-7.441,4.0
8,-0.293,-8.641,6.892,0.0
9,2.745,4.435,-11.486,4.0
10,6.244,9.862,0.909,3.0
11,5.347,8.056,3.066,3.0
12,5.16,12.883,1.443,3.0
13,1.653,1.924,-10.778,4.0
14,3.8,0.415,9.393,2.0
15,-4.373,-0.417,-4.254,1.0
16,-5.715,-7.999,6.086,0.0
17,-3.833,-2.527,-4.335,1.0
18,-7.679,-1.336,-4.229,1.0
19,-7.06,-0.935,-6.816,1.0
20,-2.069,-7.096,4.728,0.0
21,-0.648,3.265,5.243,2.0
22,-2.799,-4.99,4.602,0.0
23,-1.164,1.329,6.025,2.0
24,0.616,-7.552,8.339,0.0
25,2.341,6.788,-0.972,3.0
26,3.898,6.36,-8.895,4.0
27,3.317,6.646,1.693,3.0
28,-8.52,-0.726,-5.167,1.0
29,-1.759,5.59,5.494,2.0
30,7.875,11.657,-0.018,3.0
Ответ:
Отзыв
Правильный ответ: A2 <= -3.758
Вопрос 11
Верно
Баллов: 1,0 из 1,0
Отметить вопрос
Текст вопроса
С использованием библиотеки Pandas проводится предварительный анализ данных, содержащихся в файле data.csv. Посредством анализа данных необходимо определить среднее значение параметра A5 для элементов списка, полученных путем отбора данных по условиям А2 > 0 и A3 < 1. Ответ требуется округлить с помощью функции round() до 2 знаков и записать через символ ".".
Содержимое файла data.csv:
,A1,A2,A3,A4,A5,A6,C
0,-1.844,-5.724,5.399,-0.726,1.338,3.529,1.0
1,-1.171,-1.522,1.312,-2.735,4.157,1.589,1.0
2,5.073,3.31,2.263,0.627,-6.838,8.14,2.0
3,7.337,8.954,10.078,-0.597,-5.694,-8.924,0.0
4,7.756,9.522,7.073,1.719,-1.941,-7.76,0.0
5,-6.067,-3.552,-2.172,12.055,-1.027,9.196,4.0
6,-6.203,-3.726,-11.737,11.931,-6.474,-5.561,3.0
7,0.427,6.556,5.77,-1.031,-4.622,10.476,2.0
8,-1.855,-0.338,-7.46,10.973,-7.351,-2.017,3.0
9,4.177,8.404,8.455,2.949,-5.022,-11.118,0.0
10,-12.519,-6.159,-1.859,7.161,-3.041,12.971,4.0
11,-4.346,-5.967,-10.505,8.612,-7.295,-8.251,3.0
12,5.387,9.22,2.005,-1.851,-2.511,10.092,2.0
13,-2.612,-0.092,1.167,-2.336,1.411,0.869,1.0
14,4.855,0.748,-0.027,-0.63,-4.996,6.364,2.0
15,-11.13,-7.85,-2.068,7.775,-2.005,9.357,4.0
16,4.062,6.732,1.287,-2.924,-5.362,6.697,2.0
17,-7.395,-7.371,-1.376,9.762,-4.519,10.444,4.0
18,-4.711,-8.054,-3.441,10.949,-7.459,11.293,4.0
19,-3.446,-10.493,-9.346,10.603,-9.213,-5.445,3.0
20,1.199,11.65,3.644,-2.941,-5.09,-12.474,0.0
21,-3.125,-5.717,-9.179,7.047,-8.595,-5.086,3.0
22,-0.721,-1.203,1.881,-2.834,1.11,-0.975,1.0
23,-3.961,-5.308,-7.962,10.168,-4.591,-1.703,3.0
24,7.901,9.31,-1.287,-0.668,-0.954,9.032,2.0
25,10.354,8.928,7.446,0.981,-5.471,-10.855,0.0
26,10.577,10.765,5.761,-2.669,-4.684,-7.322,0.0
27,-0.398,-4.616,-3.928,-1.304,6.197,3.168,1.0
28,-6.942,-2.812,-4.877,7.942,-0.428,8.04,4.0
29,8.418,7.042,6.382,-0.2,-7.214,-9.603,0.0
30,-1.198,1.801,1.521,1.165,0.495,1.624,1.0
Ответ:
Отзыв
Правильный ответ: -2.98
Вопрос 12
Верно
Баллов: 1,0 из 1,0
Отметить вопрос
Текст вопроса
С помощью библиотеки Sklearn на основе алгоритма CART производится построение дерева классификации с использованием стандартных параметров. Для этого с использованием библиотеки Pandas осуществляется загрузка обучающей выборки данных из файла data.csv, который содержит значения атрибутов ("A1", "A2", "A3", "A4", "A5", "A6") и метки классов ("C"). Требуется определить коэффициенты значимости каждого атрибута (с использованием feature_importances_) и в качестве ответа записать максимальное значение коэффициента. Ответ требуется округлить с помощью функции round() до 3 знаков и записать через символ ".".
Содержимое файла data.csv:
,A1,A2,A3,A4,A5,A6,C
0,1.119,6.993,-5.725,-8.844,-7.74,-1.772,3.0
1,6.674,8.636,-5.555,3.207,-4.657,7.525,4.0
2,-1.709,13.692,6.806,-4.709,0.894,0.177,2.0
3,1.925,8.381,-9.146,-6.105,-6.269,-2.508,3.0
4,3.43,12.222,-7.79,-5.06,-6.401,-3.648,3.0
5,-6.77,6.82,-3.401,6.926,5.638,-0.038,1.0
6,-3.414,7.668,10.722,-4.792,1.95,2.227,2.0
7,6.382,5.745,-11.509,-10.349,-9.772,-3.143,3.0
8,-1.23,6.578,6.408,-5.465,5.515,-0.341,2.0
9,-3.92,5.073,-6.008,5.136,4.977,2.485,1.0
10,-9.823,2.004,-2.491,9.357,2.376,0.28,1.0
11,0.774,11.008,8.214,-6.88,-1.023,4.898,2.0
12,-3.475,3.146,-2.727,3.048,4.313,4.267,1.0
13,-8.354,4.314,-6.48,6.206,6.114,0.481,1.0
14,7.221,-1.53,-5.293,1.52,1.136,5.819,0.0
15,1.483,10.019,-5.65,-4.242,-4.932,10.855,4.0
16,6.06,10.689,-1.649,-0.375,-4.884,7.536,4.0
17,8.871,-0.994,-5.256,-2.456,1.95,6.94,0.0
18,-8.8,5.709,-2.097,1.296,7.558,4.745,1.0
19,7.084,8.365,-7.276,0.833,-4.508,8.853,4.0
20,7.304,2.8,-6.023,2.353,2.535,4.41,0.0
21,3.18,7.674,-8.164,-10.403,-10.982,-5.108,3.0
22,-0.797,10.394,11.27,-5.641,4.574,1.42,2.0
23,5.722,9.282,-6.926,-1.083,-6.85,6.713,4.0
24,1.277,7.415,10.583,-4.896,1.724,5.035,2.0
25,5.414,2.47,-6.747,5.531,2.243,6.71,0.0
26,11.404,-2.879,-8.843,0.894,2.606,2.721,0.0
27,3.586,9.033,-9.205,-9.022,-10.762,-4.526,3.0
28,7.47,0.525,-3.701,-1.795,1.61,6.232,0.0
29,8.288,-4.824,-2.788,0.809,4.323,4.37,0.0
30,4.789,8.579,-4.472,0.4,-7.073,4.438,4.0
Ответ:
Отзыв
Правильный ответ: 0.261
Вопрос 13
Верно
Баллов: 1,0 из 1,0
Отметить вопрос
Текст вопроса
С использованием библиотеки Pandas проводится предварительный анализ данных, содержащихся в файле data.csv. Посредством анализа данных необходимо определить среднее значение параметра A5 для элементов списка, полученных путем отбора данных по условиям А2 > 0 и A3 < 1. Ответ требуется округлить с помощью функции round() до 2 знаков и записать через символ ".".
Содержимое файла data.csv:
,A1,A2,A3,A4,A5,A6,C
0,-5.166,9.408,6.117,2.316,-7.111,-7.482,0.0
1,-0.532,6.474,-7.774,0.592,1.965,-11.357,4.0
2,-0.853,8.611,-6.536,5.725,3.1,-10.785,4.0
3,-0.906,-1.561,-0.978,-6.841,-3.637,-1.109,3.0
4,-14.078,8.967,2.196,3.563,-9.405,5.423,1.0
5,-0.163,6.825,-3.84,2.392,-0.907,-10.947,4.0
6,-5.466,7.575,3.719,4.087,-6.192,-10.406,0.0
7,-4.722,6.622,6.265,4.686,-7.024,-4.873,0.0
8,-3.835,-6.816,3.281,-6.616,-3.656,-1.98,3.0
9,-8.828,6.854,-0.808,3.32,-10.274,7.794,1.0
10,-8.115,6.033,2.745,7.238,-9.66,12.527,1.0
11,-4.811,9.766,3.439,1.39,-8.083,-3.176,0.0
12,-1.861,8.244,3.286,3.197,-4.818,-5.018,0.0
13,-2.572,2.674,-6.9,1.997,2.276,-11.562,4.0
14,-7.008,7.981,0.963,5.188,-9.394,11.335,1.0
15,6.848,-6.76,-9.465,-6.195,-6.04,1.442,2.0
16,-3.14,-5.807,2.083,-6.528,-3.604,-1.018,3.0
17,-4.188,8.396,5.302,3.924,-7.838,-7.251,0.0
18,-9.278,8.038,4.978,3.125,-11.205,8.395,1.0
19,9.454,-8.557,-5.19,-1.951,-5.896,-0.637,2.0
20,-3.02,6.668,-6.453,1.713,2.795,-9.217,4.0
21,-2.721,-3.711,2.823,-8.639,-0.426,-1.725,3.0
22,0.566,-3.35,3.881,-3.417,-4.648,-4.18,3.0
23,-2.536,6.899,6.285,-0.469,-6.462,-10.799,0.0
24,2.811,-5.806,-6.243,-1.405,-4.3,1.098,2.0
25,-3.744,-2.862,0.288,-5.636,-1.84,-4.314,3.0
26,4.81,-2.653,-7.93,-6.976,-2.288,-1.967,2.0
27,-10.242,6.668,1.238,1.234,-8.996,9.92,1.0
28,0.151,6.731,-4.976,7.99,2.99,-6.8,4.0
29,6.579,-8.091,-4.078,-4.828,-2.333,-1.324,2.0
30,6.326,-4.945,-2.591,-5.983,-3.4,0.346,2.0
Ответ:
Отзыв
Правильный ответ: -0.93
Вопрос 14
Верно
Баллов: 1,0 из 1,0
Отметить вопрос
Текст вопроса
С использованием библиотеки Pandas осуществляется загрузка обучающей выборки данных из файла data.csv. Последний столбец в загруженных данных отвечает за метку класса (столбец "C"), остальные столбцы отвечают за атрибуты (столбцы "A1", "A2", "A3"). Загруженные данные используются для построения дерева классификации. При этом применяется библиотека Sklearn, а построение дерева осуществляется по алгоритму CART. Требуется определить условие разбиения данных в корневом узле. Примеры записи ответов: "A3 <= -1.625" или "A2 <= -6.359".
Содержимое файла data.csv:
,A1,A2,A3,C
0,-8.883,-6.03,-7.48,2.0
1,-1.326,-7.798,1.586,3.0
2,3.168,-2.854,3.484,4.0
3,1.908,6.91,5.134,1.0
4,-0.944,-8.805,2.779,3.0
5,4.754,-3.028,1.781,4.0
6,-2.572,-7.122,-9.842,2.0
7,-9.586,-3.247,-7.218,2.0
8,-0.106,7.801,-3.869,0.0
9,2.514,-3.856,5.133,4.0
10,-3.249,7.392,7.189,1.0
11,1.812,0.905,-5.46,0.0
12,-1.937,-12.067,-0.409,3.0
13,1.588,3.422,-2.081,0.0
14,-1.391,2.755,-2.143,0.0
15,-0.221,7.994,5.06,1.0
16,-0.181,-7.9,1.591,3.0
17,-9.46,-2.904,-11.387,2.0
18,-1.168,-5.515,2.455,4.0
19,0.147,6.113,10.707,1.0
20,1.539,2.774,-8.231,0.0
21,-0.463,-8.85,-1.169,3.0
22,-1.763,5.929,5.082,1.0
23,2.462,-6.594,5.216,4.0
24,-4.952,-9.497,-7.449,2.0
25,-0.725,-7.982,0.773,3.0
26,0.321,4.296,-7.437,0.0
27,2.829,-1.463,0.568,4.0
28,-9.334,-4.174,-6.8,2.0
29,-3.41,8.368,10.054,1.0
30,-0.053,1.509,-2.846,0.0
Ответ:
Отзыв
Правильный ответ: A3 <= -1.625
Вопрос 15
Верно
Баллов: 1,0 из 1,0
Отметить вопрос
Текст вопроса
С использованием библиотеки Pandas проводится предварительный анализ данных, содержащихся в файле data.csv. Посредством анализа данных необходимо определить значение A5 первого элемента списка, полученного путем фильтрации данных по условиям А2 > 1 и A3 < 2 и сортировки данных в порядке возрастания по значению A4. Ответ записать в виде числа без округлений через символ ".".
Содержимое файла data.csv:
,A1,A2,A3,A4,A5,A6,C
0,-1.84,-5.72,5.4,-0.73,1.34,3.53,1.0
1,-1.17,-1.52,1.31,-2.73,4.16,1.59,1.0
2,5.07,3.31,2.26,0.63,-6.84,8.14,2.0
3,7.34,8.95,10.08,-0.6,-5.69,-8.92,0.0
4,7.76,9.52,7.07,1.72,-1.94,-7.76,0.0
5,-6.07,-3.55,-2.17,12.05,-1.03,9.2,4.0
6,-6.2,-3.73,-11.74,11.93,-6.47,-5.56,3.0
7,0.43,6.56,5.77,-1.03,-4.62,10.48,2.0
8,-1.86,-0.34,-7.46,10.97,-7.35,-2.02,3.0
9,4.18,8.4,8.45,2.95,-5.02,-11.12,0.0
10,-12.52,-6.16,-1.86,7.16,-3.04,12.97,4.0
11,-4.35,-5.97,-10.5,8.61,-7.29,-8.25,3.0
12,5.39,9.22,2.0,-1.85,-2.51,10.09,2.0
13,-2.61,-0.09,1.17,-2.34,1.41,0.87,1.0
14,4.86,0.75,-0.03,-0.63,-5.0,6.36,2.0
15,-11.13,-7.85,-2.07,7.77,-2.01,9.36,4.0
16,4.06,6.73,1.29,-2.92,-5.36,6.7,2.0
17,-7.4,-7.37,-1.38,9.76,-4.52,10.44,4.0
18,-4.71,-8.05,-3.44,10.95,-7.46,11.29,4.0
19,-3.45,-10.49,-9.35,10.6,-9.21,-5.45,3.0
20,1.2,11.65,3.64,-2.94,-5.09,-12.47,0.0
21,-3.13,-5.72,-9.18,7.05,-8.6,-5.09,3.0
22,-0.72,-1.2,1.88,-2.83,1.11,-0.98,1.0
23,-3.96,-5.31,-7.96,10.17,-4.59,-1.7,3.0
24,7.9,9.31,-1.29,-0.67,-0.95,9.03,2.0
25,10.35,8.93,7.45,0.98,-5.47,-10.86,0.0
26,10.58,10.76,5.76,-2.67,-4.68,-7.32,0.0
27,-0.4,-4.62,-3.93,-1.3,6.2,3.17,1.0
28,-6.94,-2.81,-4.88,7.94,-0.43,8.04,4.0
29,8.42,7.04,6.38,-0.2,-7.21,-9.6,0.0
30,-1.2,1.8,1.52,1.16,0.49,1.62,1.0
Ответ:
Отзыв
Правильный ответ: -5.36
Вопрос 16
Верно
Баллов: 1,0 из 1,0
Отметить вопрос
Текст вопроса
С помощью библиотеки Sklearn на основе алгоритма CART производится построение дерева классификации с использованием стандартных параметров. Для этого с использованием библиотеки Pandas осуществляется загрузка обучающей выборки данных из файла data.csv, который содержит значения атрибутов ("A1", "A2", "A3", "A4", "A5", "A6") и метки классов ("C"). Требуется определить коэффициенты значимости каждого атрибута (с использованием feature_importances_) и в качестве ответа записать максимальное значение коэффициента. Ответ требуется округлить с помощью функции round() до 3 знаков и записать через символ ".".