engineerklub | Дата: Суббота, 05.04.2025, 05:40 | Сообщение # 1 |
 Генералиссимус
Группа: Администраторы
Сообщений: 34056
Статус: Offline
| Основы обработки больших данных (тест с ответами Синергия/МОИ/ МТИ /МОСАП)
1. Агрегация данных представляет собой: *процесс создания таблиц *процесс объединения различных строк из таблиц с помощью специальных функций *статистическая зависимость одной величины от другой *использование математических формул 2. Вертикальное масштабирование Больших данных характеризуется: *возможностью наращивания мощностей простым добавлением аналогично функционирующих узлов в существующую инфраструктуру, например, второго веб-сервера, которому достается часть нагрузки по обслуживанию посещений сайта *возможностью наращивания мощностей за счет увеличения внутренних ресурсов сервера: процессоров, памяти, дисков и сетевых ресурсов *вертикальным масштабированием горизонтально масштабированных узлов, уже присутствующих в инфраструктуре *возможностью структурирования большого количества информации 3. Выброс данных характеризуется: *выгрузка данных на сервер *выдача ответа в поисковой строке *аномальный результат измерения, выделяющийся из общей выборки *результат измерения, не выделяющийся из общей выборки 4. К неструктурированных данным относятся: *генеалогическое дерево *электронное письмо *таблица с данными клиентов *журналы веб-серверов 5. К трем ключевым характеристикам, оценивающим качество обработки информации (3V) относятся: *длительность хранения данных *величина физического объема *способность снизить общую нагрузку на серверы *скорость прироста обработки данных *способность одновременно обрабатывать различные типы данных 6. Какая технология используются для сбора и хранения данных? *Apache Spark *Apache Hadoop *Scikit-learn *Google Chart 7. Какие существуют методы анализа больших данных? *Статистический анализ, регрессионный, кластерный *Факторный анализ, корреляционный, статистический, многомерный *Статистический анализ, регрессионный, факторный, кластерный, корреляционный *Регрессионный анализ, факторный, корреляционный 8. Какие существуют цели и задачи Data Science? *Распознавание видео *Технологии обработки таких данных *Управление качеством данных *Построение рекомендательных моделей *Сегментация 9. Корреляция представляет собой: *статистическую зависимость одной величины от другой *процесс объединения различных строк из таблиц с помощью специальных функций *процесс создание зависимостей между несвязанными значениями *независимость одной величины от другой 10. Реляционная база данных характеризуется: *отсутствием связей между данными *предопределенными связями между данными *древовидной структурой данных *данные моделируются в виде объектов, их атрибутов, методов и классов 11. Самым распространенным типом баз данных в IT системах является: *Иерархическая *Реляционная *Объектная *Функциональная 12. Уникальная в пределах схемы последовательность из букв, цифр и знаков представляет собой: *реляционное деление *идентификатор *атомарность *регистр 13. Что не относится к методам статистического анализа? *Кросстабуляция (сопряжение) *Анализ соответствий *Факторный анализ *Статическое наблюдение 14. Что отличает визуализацию данных от графического интерфейса? *Краткость *Масштабируемость *Контринтуитивность *Точность 15.Что такое «большие данные»? *Термин, используемый для описания огромного объема данных, который растет со временем в геометрической прогрессии *Совокупность данных объективного характера, описывающая некий социум в пространстве и во времени *Большие данные – это огромная PR-акция крупных вендоров и не более того *Большие данные – это явление, когда цифровые данные наиболее полно представляют изучаемый объект
СКАЧАТЬ
|
|
| |