| engineerklub | Дата: Пятница, 27.02.2026, 09:03 | Сообщение # 1 |
 Генералиссимус
Группа: Администраторы
Сообщений: 38070
Статус: Offline
| Анализ данных, Знакомство с библиотеками Python. Применение регрессионных методов машинного обучения. Применение классификационных методов машинного обучения.
Часть 1. Знакомство с библиотеками Python.
Часть 2. Применение регрессионных методов машинного обучения.
Часть 3. Применение классификационных методов машинного обучения.
Данная контрольная работа выполняется в любом блокноте Python (Anaconda, Colab, PyCharm). Для выполнения первой части выбирается один из 10 вариантов файлов, представленных в таблице 1, в соответствии с последней цифрой пароля. Файлы размещены в папке «Приложение 1». Для выполнения задания второй части выбирается один из 10 вариантов файлов, представленных в таблице 2, в соответствии с последней цифрой пароля. Файлы размещены в папке «Приложение 2». Отчет по контрольной работе необходимо представить в текстовом формате с подробным описанием этапов выполнения заданий, приложить скрины листингов и результатов выполнения. Включить в отчет ответы на контрольные вопросы.
Часть 1. Задание
Создать структуру данных Series из Python и Numpy ; Создать структуру данных DataFrame любым из способов. Создайте csv- файл: создайте строку, содержащую данные в формате CSV и постройте на их базе DataFrame. Загрузите данные из файла csv в структуру DataFrame. Варианты:
Таблица 1
Вариант
Файл
1
'Protein Consumption in
2
bank_marketing_dataset.csv
3
Churn.csv
4
heart.csv
5
ВВП России.csv
6
Дети с особенностями.csv
7
mba_decision_dataset
8
StudentsPerformance
9
winequality-white
0
Obesity prediction
Файл из архива (DataSet,) ** Файлы могут быть не подготовлен для обработки данных, вам необходимо, открыть файл в любом текстовом редакторе и расставить разделители согласно тому как требует это формат csv.
Выведите данные на просмотр Выведите случайную выборку 10 из фреймов данных Проверьте хвост набора данных — последние записи в наборе данных Посмотрите размер набора данных Выведите название столбцов Проверить файл на пропуски данных Заполнить имеющиеся пропуски 0. Добавить в имеющуюся структуру строку и столбец. Вывести строки структуры за исключением первых 7. Задайте новую структуру DataFrame и объедините с текущей структурой (concat). Задайте еще одну структуру DataFrame и соедините с текущей структурой по вертикали (применив join). Загрузите исходный файл заново и выполните над данными следующие статистические операции, отмеченные в таблице, для числовых значений необходимо создать фрейм только для числовых значений и работать с ним: Методы для расчета статистик
Метод
Описание
count
Количество не-NAобъектов
sum
Сумма
mean
Среднее значение
mad
Среднее абсолютное отклонение
median
Медиана
min
Минимум
max
Максимум
mode
Мода
abs
Абсолютное значение
std
Стандартное отклонение
quantile
Квантиль (%)
Вывести сводную информацию по статистикам (describe()). Вывести описательную статистику всех категориальных переменных На основе данных таблицы построить гистограммы для подходящих значений.
СКАЧАТЬ
|
| |
|
|