Пятница, 27.03.2026, 06:34
Приветствую Вас, Гость
[ Новые сообщения · Участники · Правила форума · Поиск · RSS ]
  • Страница 1 из 1
  • 1
Анализ данных, Знакомство с библиотеками Python. Применение
engineerklubДата: Пятница, 27.02.2026, 09:03 | Сообщение # 1
Генералиссимус
Группа: Администраторы
Сообщений: 38070
Репутация: 1
Статус: Offline
Анализ данных, Знакомство с библиотеками Python. Применение регрессионных методов машинного обучения. Применение классификационных методов машинного обучения.

Часть 1. Знакомство с библиотеками Python.

Часть 2. Применение регрессионных методов машинного обучения.

Часть 3. Применение классификационных методов машинного обучения.

Данная контрольная работа выполняется в любом блокноте Python (Anaconda, Colab, PyCharm).
Для выполнения первой части выбирается один из 10 вариантов файлов, представленных в таблице 1, в соответствии с последней цифрой пароля. Файлы размещены в папке «Приложение 1».
Для выполнения задания второй части выбирается один из 10 вариантов файлов, представленных в таблице 2, в соответствии с последней цифрой пароля. Файлы размещены в папке «Приложение 2».
Отчет по контрольной работе необходимо представить в текстовом формате с подробным описанием этапов выполнения заданий, приложить скрины листингов и результатов выполнения. Включить в отчет ответы на контрольные вопросы.

Часть 1. Задание

Создать структуру данных Series из Python и Numpy ;
Создать структуру данных DataFrame любым из способов.
Создайте csv- файл: создайте строку, содержащую данные в формате CSV и постройте на их базе DataFrame.
Загрузите данные из файла csv в структуру DataFrame.
Варианты:

Таблица 1

Вариант

Файл

1

'Protein Consumption in

2

bank_marketing_dataset.csv

3

Churn.csv

4

heart.csv

5

ВВП России.csv

6

Дети с особенностями.csv

7

mba_decision_dataset

8

StudentsPerformance

9

winequality-white

0

Obesity prediction

Файл из архива (DataSet,)
** Файлы могут быть не подготовлен для обработки данных, вам необходимо, открыть файл в любом текстовом редакторе и расставить разделители согласно тому как требует это формат csv.

Выведите данные на просмотр
Выведите случайную выборку 10 из фреймов данных
Проверьте хвост набора данных — последние записи в наборе данных
Посмотрите размер набора данных
Выведите название столбцов
Проверить файл на пропуски данных
Заполнить имеющиеся пропуски 0.
Добавить в имеющуюся структуру строку и столбец.
Вывести строки структуры за исключением первых 7.
Задайте новую структуру DataFrame и объедините с текущей структурой (concat).
Задайте еще одну структуру DataFrame и соедините с текущей структурой по вертикали (применив join).
Загрузите исходный файл заново и выполните над данными следующие статистические операции, отмеченные в таблице, для числовых значений необходимо создать фрейм только для числовых значений и работать с ним:
Методы для расчета статистик

Метод

Описание

count

Количество не-NAобъектов

sum

Сумма

mean

Среднее значение

mad

Среднее абсолютное отклонение

median

Медиана

min

Минимум

max

Максимум

mode

Мода

abs

Абсолютное значение

std

Стандартное отклонение

quantile

Квантиль (%)

Вывести сводную информацию по статистикам (describe()).
Вывести описательную статистику всех категориальных переменных
На основе данных таблицы построить гистограммы для подходящих значений.

СКАЧАТЬ
 
  • Страница 1 из 1
  • 1
Поиск:

Рейтинг@Mail.ru