Файл: С помощью библиотеки Sklearn на основе алгоритма cart производится построение дерева классификации с использованием стандартных параметров.docx

ВУЗ: Не указан

Категория: Не указан

Дисциплина: Не указана

Добавлен: 11.01.2024

Просмотров: 53

Скачиваний: 1

ВНИМАНИЕ! Если данный файл нарушает Ваши авторские права, то обязательно сообщите нам.

Вопрос 1

Верно

Баллов: 1,0 из 1,0

Отметить вопрос

Текст вопроса

С помощью библиотеки Sklearn на основе алгоритма CART производится построение дерева классификации с использованием стандартных параметров. Для этого с использованием библиотеки Pandas осуществляется загрузка обучающей выборки данных из файла data.csv, который содержит значения атрибутов ("A1", "A2", "A3", "A4", "A5", "A6") и метки классов ("C"). Требуется определить коэффициенты значимости каждого атрибута (с использованием feature_importances_) и в качестве ответа записать максимальное значение коэффициента. Ответ требуется округлить с помощью функции round() до 3 знаков и записать через символ ".".

Содержимое файла data.csv:

,A1,A2,A3,A4,A5,A6,C

0,-9.538,-4.056,-9.28,2.355,-8.435,0.489,1.0

1,-2.231,5.456,-4.894,-3.27,6.666,6.749,0.0

2,-6.202,-5.357,-11.762,1.6,-12.144,-0.386,1.0

3,4.87,7.996,-4.063,-6.615,-2.884,9.03,4.0

4,-4.559,0.785,-5.762,5.326,-0.339,-7.161,3.0

5,2.647,-0.612,5.155,0.777,-8.403,0.22,2.0

6,0.856,6.573,-2.335,-2.828,0.054,8.507,4.0

7,-4.81,-0.849,-5.78,3.793,-1.472,-4.868,3.0

8,2.971,6.87,-0.414,-4.173,-3.263,8.482,4.0

9,-0.592,-0.675,-6.029,-1.831,10.107,7.662,0.0

10,1.922,-5.891,4.815,2.443,-10.554,0.799,2.0

11,3.434,-3.856,3.37,2.369,-10.817,-0.298,2.0

12,-7.788,1.119,-6.471,4.604,0.535,-8.16,3.0

13,-0.732,4.222,-8.678,-0.319,9.885,9.631,0.0

14,1.669,4.832,-5.047,-1.739,-3.16,12.709,4.0

15,-5.74,-8.442,-9.13,-0.055,-6.936,-0.565,1.0

16,-0.333,4.464,-3.876,-1.912,8.735,11.804,0.0

17,-6.407,-1.552,-4.852,1.267,4.161,-7.005,3.0

18,2.15,-2.981,2.145,2.79,-7.817,2.15,2.0

19,-0.19,0.334,-2.086,2.884,7.464,11.475,0.0

20,-6.26,-7.531,-8.681,1.152,-9.451,-2.641,1.0

21,-13.32,-7.799,-10.153,-2.217,-11.322,-0.109,1.0

22,-3.143,-0.714,-6.054,6.006,-3.633,-6.743,3.0

23,-0.522,3.703,-2.692,4.169,5.371,6.673,0.0

24,3.232,6.402,-1.207,-2.02,9.551,4.204,0.0

25,-0.284,2.513,-4.128,-5.065,-1.349,7.162,4.0

26,-3.168,3.685,-5.913,-5.02,-0.945,7.607,4.0

27,-5.677,-2.779,-4.588,0.618,-3.662,-7.144,3.0

28,1.314,-1.74,2.169,2.67,-11.027,-2.311,2.0

29,2.068,-2.712,2.475,-1.534,-11.333,1.354,2.0

30,-8.638,-6.074,-7.613,-2.895,-10.003,3.453,1.0

Ответ: 

Отзыв

Правильный ответ: 0.516

Вопрос 2

Верно

Баллов: 1,0 из 1,0

Отметить вопрос

Текст вопроса

С использованием библиотеки Pandas осуществляется загрузка обучающей выборки данных из файла data.csv. Последний столбец в загруженных данных отвечает за метку класса (столбец "C"), остальные столбцы отвечают за атрибуты (столбцы "A1", "A2", "A3"). Загруженные данные используются для построения дерева классификации. При этом применяется библиотека Sklearn, а построение дерева осуществляется по алгоритму CART. Требуется определить условие разбиения данных в корневом узле. Примеры записи ответов: "A3 <= -1.625" или "A2 <= -6.359".


Содержимое файла data.csv:

,A1,A2,A3,C

0,-2.319,11.028,8.93,4.0

1,5.957,8.617,-0.499,3.0

2,0.863,3.042,3.768,3.0

3,3.447,-2.898,1.378,1.0

4,5.341,1.766,3.829,1.0

5,-7.518,3.964,-1.357,2.0

6,1.266,4.139,3.335,1.0

7,-6.194,3.437,-0.909,2.0

8,8.831,-0.551,-8.794,0.0

9,-8.241,0.848,-4.699,2.0

10,4.791,-1.591,-4.696,0.0

11,7.839,-3.075,-7.123,0.0

12,1.755,3.1,4.727,1.0

13,4.564,5.445,-1.141,3.0

14,0.698,8.246,1.256,3.0

15,10.119,1.618,-7.186,0.0

16,7.055,7.39,4.102,3.0

17,1.996,10.254,10.027,4.0

18,8.712,-0.288,-5.488,0.0

19,-8.325,2.735,-5.773,2.0

20,9.702,-3.283,-2.71,0.0

21,-3.06,10.299,9.725,4.0

22,9.093,0.216,-3.983,0.0

23,-2.762,8.867,9.276,4.0

24,-6.672,5.189,-4.068,2.0

25,-7.67,8.056,8.483,4.0

26,-6.452,5.727,-4.52,2.0

27,-1.118,8.92,7.81,4.0

28,3.207,5.186,2.9,1.0

29,2.39,2.529,0.189,1.0

30,4.447,7.186,0.283,3.0

Ответ: 

Отзыв

Правильный ответ: A3 <= 6.269

Вопрос 3

Верно

Баллов: 1,0 из 1,0

Отметить вопрос

Текст вопроса

С использованием библиотеки Pandas проводится предварительный анализ данных, содержащихся в файле data.csv. Посредством анализа данных необходимо определить среднее значение параметра A5 для элементов списка, полученных путем отбора данных по условиям А2 > 0 и A3 < 1. Ответ требуется округлить с помощью функции round() до 2 знаков и записать через символ ".".

Содержимое файла data.csv:

,A1,A2,A3,A4,A5,A6,C

0,3.672,-5.043,-8.236,-3.135,1.911,8.775,3.0

1,-4.605,-6.15,5.826,-4.895,-2.685,-4.789,0.0

2,4.925,-4.178,-4.8,0.52,4.603,9.665,3.0

3,-2.456,3.7,8.275,0.319,8.581,-0.453,1.0

4,4.061,-0.167,-0.811,6.26,0.039,6.886,4.0

5,1.529,-10.986,7.055,-4.6,-3.217,-3.963,0.0

6,6.192,-8.745,-6.35,-1.537,4.286,10.923,3.0

7,0.597,0.779,6.073,0.242,9.872,1.707,1.0

8,10.443,-2.416,-7.416,-3.697,5.293,12.204,3.0

9,13.154,4.888,-9.0,8.72,-1.426,-8.249,2.0

10,10.189,2.167,-1.639,10.517,-3.158,5.408,4.0

11,0.259,-6.95,5.924,-5.124,0.113,-3.388,0.0

12,8.341,4.781,-8.303,5.648,-2.545,-8.327,2.0

13,6.059,3.65,4.353,8.291,-1.836,2.994,4.0

14,-1.828,-7.61,5.415,-2.861,-3.37,-4.585,0.0

15,8.561,-0.901,2.628,3.824,0.973,4.485,4.0

16,2.1,2.333,7.208,3.328,9.434,3.758,1.0

17,2.579,-9.946,6.856,-4.423,1.591,-4.275,0.0

18,3.142,3.016,-8.577,6.58,-2.85,-12.496,2.0

19,-1.786,-11.109,4.671,-8.32,1.823,-2.656,0.0

20,6.244,-2.266,3.88,4.206,-0.991,6.357,4.0

21,9.539,4.52,-9.22,8.261,-0.394,-8.381,2.0

22,2.806,-7.235,-7.343,-0.554,1.936,12.384,3.0

23,-5.234,2.445,2.15,2.486,11.367,5.455,1.0

24,-4.52,-8.474,2.922,-5.361,-0.843,-4.933,0.0

25,3.103,2.317,-10.556,7.66,-2.469,-6.88,2.0

26,-1.15,4.123,6.939,4.922,8.603,2.289,1.0

27,7.893,2.39,-9.578,7.813,-1.35,-4.978,2.0

28,6.053,-4.346,-6.1,-1.093,5.236,8.06,3.0

29,-3.099,2.883,6.599,1.691,5.923,2.361,1.0

30,7.278,2.546,3.563,8.371,1.399,8.689,4.0

Ответ: 

Отзыв

Правильный ответ: -2.03

Вопрос 4

Верно

Баллов: 1,0 из 1,0



Отметить вопрос

Текст вопроса

С помощью библиотеки Sklearn на основе алгоритма CART производится построение дерева классификации с использованием стандартных параметров. Для этого с использованием библиотеки Pandas осуществляется загрузка обучающей выборки данных из файла data.csv, который содержит значения атрибутов ("A1", "A2", "A3", "A4", "A5", "A6") и метки классов ("C"). Требуется определить коэффициенты значимости каждого атрибута (с использованием feature_importances_) и в качестве ответа записать максимальное значение коэффициента. Ответ требуется округлить с помощью функции round() до 3 знаков и записать через символ ".".

Содержимое файла data.csv:

,A1,A2,A3,A4,A5,A6,C

0,-5.166,9.408,6.117,2.316,-7.111,-7.482,0.0

1,-0.532,6.474,-7.774,0.592,1.965,-11.357,4.0

2,-0.853,8.611,-6.536,5.725,3.1,-10.785,4.0

3,-0.906,-1.561,-0.978,-6.841,-3.637,-1.109,3.0

4,-14.078,8.967,2.196,3.563,-9.405,5.423,1.0

5,-0.163,6.825,-3.84,2.392,-0.907,-10.947,4.0

6,-5.466,7.575,3.719,4.087,-6.192,-10.406,0.0

7,-4.722,6.622,6.265,4.686,-7.024,-4.873,0.0

8,-3.835,-6.816,3.281,-6.616,-3.656,-1.98,3.0

9,-8.828,6.854,-0.808,3.32,-10.274,7.794,1.0

10,-8.115,6.033,2.745,7.238,-9.66,12.527,1.0

11,-4.811,9.766,3.439,1.39,-8.083,-3.176,0.0

12,-1.861,8.244,3.286,3.197,-4.818,-5.018,0.0

13,-2.572,2.674,-6.9,1.997,2.276,-11.562,4.0

14,-7.008,7.981,0.963,5.188,-9.394,11.335,1.0

15,6.848,-6.76,-9.465,-6.195,-6.04,1.442,2.0

16,-3.14,-5.807,2.083,-6.528,-3.604,-1.018,3.0

17,-4.188,8.396,5.302,3.924,-7.838,-7.251,0.0

18,-9.278,8.038,4.978,3.125,-11.205,8.395,1.0

19,9.454,-8.557,-5.19,-1.951,-5.896,-0.637,2.0

20,-3.02,6.668,-6.453,1.713,2.795,-9.217,4.0

21,-2.721,-3.711,2.823,-8.639,-0.426,-1.725,3.0

22,0.566,-3.35,3.881,-3.417,-4.648,-4.18,3.0

23,-2.536,6.899,6.285,-0.469,-6.462,-10.799,0.0

24,2.811,-5.806,-6.243,-1.405,-4.3,1.098,2.0

25,-3.744,-2.862,0.288,-5.636,-1.84,-4.314,3.0

26,4.81,-2.653,-7.93,-6.976,-2.288,-1.967,2.0

27,-10.242,6.668,1.238,1.234,-8.996,9.92,1.0

28,0.151,6.731,-4.976,7.99,2.99,-6.8,4.0

29,6.579,-8.091,-4.078,-4.828,-2.333,-1.324,2.0

30,6.326,-4.945,-2.591,-5.983,-3.4,0.346,2.0

Ответ: 

Отзыв

Правильный ответ: 0.503

Вопрос 5

Верно

Баллов: 1,0 из 1,0

Отметить вопрос

Текст вопроса

С помощью библиотеки Sklearn на основе алгоритма CART производится построение дерева классификации с использованием стандартных параметров. Для этого с использованием библиотеки Pandas осуществляется загрузка обучающей выборки данных из файла data.csv, который содержит значения атрибутов ("A1", "A2", "A3", "A4", "A5", "A6") и метки классов ("C"). Требуется определить коэффициенты значимости каждого атрибута (с использованием feature_importances_) и в качестве ответа записать максимальное значение коэффициента. Ответ требуется округлить с помощью функции round() до 3 знаков и записать через символ ".".


Содержимое файла data.csv:

,A1,A2,A3,A4,A5,A6,C

0,-7.537,-0.725,-8.433,6.89,6.713,1.924,2.0

1,-1.907,-7.939,-2.743,2.169,1.343,-4.065,0.0

2,-3.584,3.158,-6.273,-3.797,1.815,5.753,1.0

3,-0.539,-6.762,1.997,-2.982,-1.593,-2.309,0.0

4,4.42,-6.531,-0.832,-11.204,-1.188,-6.556,3.0

5,-0.848,-13.199,0.155,-1.558,-1.672,-2.741,0.0

6,-7.096,3.041,-3.414,-8.519,-7.896,-3.857,4.0

7,8.152,-7.56,2.341,-9.243,2.046,-8.964,3.0

8,-9.383,4.467,-3.246,-5.098,4.77,-4.104,1.0

9,-9.58,1.718,-9.181,-7.2,-6.225,-5.703,4.0

10,-11.226,2.203,-2.617,-8.73,2.044,0.428,1.0

11,-3.638,1.153,-7.75,4.54,6.429,-1.236,2.0

12,-7.214,4.07,-4.77,-4.53,0.225,3.752,1.0

13,-0.057,-9.386,-0.665,-1.118,0.408,-4.155,0.0

14,-7.753,4.938,-3.741,-10.035,-4.265,-1.534,4.0

15,-5.361,-9.389,-0.362,-4.172,-0.544,-1.923,0.0

16,-8.644,4.234,-2.809,-7.256,-6.502,-1.975,4.0

17,-6.831,3.087,-3.243,-3.531,2.831,3.396,1.0

18,8.324,-7.012,1.308,-8.687,-1.894,-12.209,3.0

19,-9.113,-0.91,-6.864,4.673,5.682,-1.973,2.0

20,-10.273,1.964,-5.315,5.96,4.242,-0.619,2.0

21,-4.258,4.882,-4.815,-7.432,5.157,3.019,1.0

22,7.661,-6.859,-0.624,-10.446,-0.645,-8.699,3.0

23,-5.71,2.797,-4.807,3.719,9.298,-3.645,2.0

24,-2.208,-2.675,-8.354,6.571,6.432,0.732,2.0

25,7.414,-7.412,8.322,-7.052,1.626,-12.041,3.0

26,-5.535,3.452,-7.748,-9.276,-8.037,0.605,4.0

27,3.838,-12.572,6.664,-6.753,2.148,-8.927,3.0

28,-2.031,-9.63,1.86,1.263,-2.862,-2.377,0.0

29,-4.123,-9.788,0.455,3.169,-6.462,-3.168,0.0

30,-5.798,3.196,-8.386,-8.537,-4.876,-1.759,4.0

Ответ: 

Отзыв

Правильный ответ: 0.261

Вопрос 6

Верно

Баллов: 1,0 из 1,0

Отметить вопрос

Текст вопроса

С помощью библиотеки Sklearn на основе алгоритма CART производится построение дерева классификации с использованием стандартных параметров. Для этого, с использованием библиотеки Pandas осуществляется загрузка обучающей выборки данных из файла data.csv, который содержит значения атрибутов ("A1", "A2", "A3", "A4", "A5", "A6") и метки классов ("C"). Требуется определить коэффициенты значимости каждого атрибута (с использованием feature_importances_) и в качестве ответа записать максимальное значение коэффициента. Ответ требуется округлить с помощью функции round() до 3 знаков и записать через символ ".".

Содержимое файла data.csv:

,A1,A2,A3,A4,A5,A6,C

0,-3.863,-0.728,3.802,-1.497,-2.247,7.914,3.0

1,3.488,-4.003,-6.862,-2.646,8.789,0.707,0.0

2,-8.6,11.316,2.572,10.827,1.917,-1.055,1.0

3,-9.985,-1.117,-8.296,7.753,8.393,-2.771,2.0

4,1.66,4.427,3.747,-4.097,-0.961,9.372,3.0

5,1.869,-3.224,-3.016,-3.001,6.419,1.283,0.0

6,-3.626,4.136,3.622,-5.658,4.366,10.237,3.0

7,-6.662,9.44,5.262,12.704,-3.502,0.719,1.0

8,-9.8,-1.971,-6.532,7.019,7.156,-0.405,2.0

9,3.212,-1.309,-5.863,-6.61,11.66,-2.429,0.0

10,8.595,-8.764,-3.645,-3.025,6.308,9.28,4.0

11,0.709,2.498,6.624,-4.864,4.392,7.018,3.0

12,10.46,-9.331,-1.677,-4.391,5.584,7.117,4.0

13,2.858,-5.269,-10.955,-3.721,10.977,-4.319,0.0

14,9.477,-7.321,-2.246,-5.6,2.61,5.471,4.0

15,-8.423,4.824,-7.738,7.061,7.695,-3.186,2.0

16,-8.505,11.018,6.45,9.735,-3.032,3.899,1.0

17,-12.51,6.194,-4.002,6.811,6.944,-2.619,2.0

18,4.218,-5.037,-8.965,-3.214,6.999,-5.709,0.0

19,2.761,-4.58,-9.528,-3.072,9.385,-4.07,0.0

20,8.304,-7.202,-1.283,-0.792,4.443,4.316,4.0


21,7.529,-8.224,-5.104,-5.192,6.892,6.155,4.0

22,8.635,-10.139,-2.525,-3.926,5.187,7.9,4.0

23,-4.11,4.463,5.923,-6.001,1.019,8.083,3.0

24,-9.478,4.042,-8.332,7.11,6.497,-2.479,2.0

25,1.87,-3.175,-9.158,-4.151,5.574,0.451,0.0

26,-7.352,11.815,3.983,4.989,0.301,2.709,1.0

27,-6.958,9.009,4.157,10.711,-2.78,1.003,1.0

28,-2.827,-0.044,-6.152,9.987,9.428,1.951,2.0

29,-1.384,3.525,9.056,-5.97,2.965,12.334,3.0

30,-8.357,12.171,2.258,9.861,-4.328,3.938,1.0

Ответ: 

Отзыв

Правильный ответ: 0.497

Вопрос 7

Верно

Баллов: 1,0 из 1,0

Отметить вопрос

Текст вопроса

С использованием библиотеки Pandas осуществляется загрузка обучающей выборки данных из файла data.csv. Последний столбец в загруженных данных отвечает за метку класса (столбец "C"), остальные столбцы отвечают за атрибуты (столбцы "A1", "A2", "A3"). Загруженные данные используются для построения дерева классификации. При этом применяется библиотека Sklearn, а построение дерева осуществляется по алгоритму CART. Требуется определить условие разбиения данных в корневом узле. Примеры записи ответов: "A3 <= -1.625" или "A2 <= -6.359".

Содержимое файла data.csv:

,A1,A2,A3,C

0,7.865,-1.714,2.339,1.0

1,-1.482,-7.0,7.082,4.0

2,9.875,-1.534,4.835,1.0

3,-4.258,5.489,-1.388,0.0

4,-0.128,-7.847,8.331,4.0

5,-4.643,-6.408,6.792,3.0

6,-8.448,11.064,-2.95,0.0

7,0.351,-6.973,8.123,4.0

8,-6.839,-6.992,4.877,3.0

9,7.702,3.136,-4.556,2.0

10,-3.657,-4.169,7.171,4.0

11,7.581,2.818,2.758,1.0

12,-8.287,-5.918,6.076,3.0

13,0.517,0.144,-3.259,2.0

14,-1.45,-7.277,6.383,4.0

15,-4.805,7.367,-3.408,0.0

16,-7.381,5.435,-7.501,0.0

17,5.422,-0.32,-3.602,2.0

18,-6.68,-8.607,5.857,3.0

19,-7.934,-6.889,5.381,3.0

20,5.207,-1.628,-3.964,2.0

21,-7.897,6.993,-6.314,0.0

22,7.329,-1.22,-0.053,1.0

23,-6.33,-8.801,2.064,3.0

24,9.316,3.705,4.157,1.0

25,-5.065,8.067,-5.333,0.0

26,2.549,5.698,-4.484,2.0

27,-6.771,4.226,-4.042,0.0

28,3.845,-0.2,-3.638,2.0

29,-1.495,-7.772,8.475,4.0

30,7.397,-0.263,4.502,1.0

Ответ: 

Отзыв

Правильный ответ: A3 <= -0.721

Вопрос 8

Верно

Баллов: 1,0 из 1,0

Отметить вопрос

Текст вопроса

С использованием библиотеки Pandas проводится предварительный анализ данных, содержащихся в файле data.csv. Посредством анализа данных необходимо определить значение A5 первого элемента списка, полученного путем фильтрации данных по условиям А2 > 1 и A3 < 2 и сортировки данных в порядке возрастания по значению A4. Ответ записать в виде числа без округлений через символ ".".