Системы обработки больших данных (Big Data).фмен_БАК. Синерг
|
|
engineerklub | Дата: Пятница, 10.11.2023, 16:38 | Сообщение # 1 |
Генералиссимус
Группа: Администраторы
Сообщений: 28530
Статус: Offline
| Системы обработки больших данных (Big Data).фмен_БАК. Синергия/МОИ/ МТИ /МОСАП
1. Data Mining — это процесс обнаружения в сырых данных… *ранее сформулированных гипотез * неочевидных закономерностей *практических закономерностей *объективных закономерностей *большого количества закономерностей 2. R2 –это *коэффициент множественной корреляции * коэффициент множественной детерминации *частным коэффициентом корреляции 3. Алгоритм k-средних предназначен для решения задачи: *Классификации * Кластеризации *Прогнозирования *Снижения размерности 4. Большие данные – это: *Данные объемом более 10Тб *Данные объемом более 100Тб *Данные объемом более 150Тб *Нет ограничений на минимальный объем 5. Большинство методов Data mining были разработаны в рамках … *классического анализа данных *теории баз данных *теории искусственного интеллекта 6. В какой гистограмме прямоугольники, изображающие числовые данные, располагаются друг над другом: *В гистограмме с группировкой *В нормированной гистограмме * В гистограмме с накоплением 7. В каком типе гистограмм прямоугольники, которые отображают данные, располагаются друг над другом: *В гистограммах с группировкой * В гистограммах с накоплением *В объёмных гистограммах 8. В каком типе гистограмм прямоугольники, являющиеся графическими изображениями числовых данных из разных наборов, располагаются друг с другом: *В объёмных гистограммах * В гистограммах с группировкой *В гистограммах с накоплением 9. В процессе работы Data Mining программы пользователь может получить: *рый процент недостоверных результатов *только верные результаты, ложные выводы исключены * только статистически достоверные результаты 10. В ходе эксперимента получена реализация двумерной выборки. Известно, что первое наблюдение (5;3), а второе (3;1). Можно сказать, что эти пары * согласованы *несогласованы *коррелированны *некоррелированны 11. Выбор в электронной таблице данных, соответствующих определенным условиям: *Сортировка *Анализ * Фильтрация 12. Графическое представление числовых данных, позволяющее быстро оценить соотношение нескольких величин: * Диаграмма *Статистика *Инфографика 13. Деревья решений относятся к группам … *статистических методов *кибернетических методов *логических методов *методов кросс-табуляции 14. Для какой шкалы применимы только такие операции как равно и не равно? * номинальная шкала *порядковая шкала *интервальная шкала 15. Доверительный интервал это- *интервал от минимального до максимального значения признака *среднеквадратическое отклонение * интервал, содержаний оцениваемый параметр генеральной совокупности *стандартная ошибка среднего
СКАЧАТЬ
|
|
| |
engineerklub | Дата: Пятница, 10.11.2023, 16:39 | Сообщение # 2 |
Генералиссимус
Группа: Администраторы
Сообщений: 28530
Статус: Offline
| 16. Значение коэффициента корреляции расположены в диапазоне * от -1 до +1 *от 0 до +1 *от 0 до -1 *от -2 до +2 17. Значимость множественной корреляции оценивается по *критерий Пирсона * критерий Фишера *критерий Лапласа *критерий Романовского 18. Известно, что коэффициент корреляции случайных величин и равен нулю. Это означает, что * линейная связь между случайными величинами и отсутствует *случайные величины и линейно зависимы *случайные величины и зависимы *случайные величины и независимы * если случайный вектор является гауссовским, то случайные величины и независимы 19. Интервальная шкала – это шкала… *содержащая категории, которые могут упорядочиваться, однако разности не имеют смысла *разности между значениями которой могут быть вычислены, однако их отношения не имеет смысла *содержащая только категории, которые не могут упорядочиваться 20. К какому типу диаграмм относятся плоские и объёмные круговые диаграммы: * К круговым диаграммам *К циклопическим диаграммам *К спектральным диаграммам 21. К технологиям, используемым для сбора и обработки Больших Данных, можно отнести: *программное обеспечение *оборудование *социальные сети *сервисные услуги * СУБДД 22. Как называется гистограмма, в которой вертикальная ось имеет шкалу в процентах: *Гистограмма с накоплением *Гистограмма с группировкой * Нормированная гистограмма с накоплением 23. Как называется тип диаграмм, в котором геометрические фигуры располагаются горизонтально: *Пропорциональная диаграмма * Линейчатая диаграмма *Гистограмма 24. Как называется тип представления данных, который позволяет оценивать соотношение нескольких величин: * Диаграмма *График *Таблица 25. Какая функция в R возвращает количество знаков в строке x? *format(x) *paste(…) *tolower(x) * nchar(x) 26. Какая функция в R используется для конвертации векторов в текстовые переменные и объединяет их в одно текстовое выражение? *format(x) * paste(…) *tolower(x) *nchar(x) 27. Какая функция в R приводит строку к нижнему регистру? *format(x) *paste(…) * tolower(x) *nchar(x) 28. Какая функция в R форматирует объект так, чтобы он красиво выглядел на экране? * format(x) *paste(…) *tolower(x) *nchar(x) 29. Какие диаграммы аналогичны гистограммам: * Линейчатые *Лепестковые *Круговые 30. Какие диаграммы можно использовать для построения графиков функций: * Точечные *Лепестковые *Поверхностные 31. Какие диаграммы с гладкими кривыми можно использовать для построения графиков функций: *Линейчатые диаграммы *Нормированные гистограммы с накоплением * Точечные диаграммы
СКАЧАТЬ
|
|
| |
engineerklub | Дата: Пятница, 10.11.2023, 16:39 | Сообщение # 3 |
Генералиссимус
Группа: Администраторы
Сообщений: 28530
Статус: Offline
| 32. Какие диаграммы теряют наглядность при большом количестве элементов данных и позволяют отобразить только один ряд данных: * Круговые диаграммы *Линейчатые диаграммы *Гистограммы с накоплением 33. Какие коэффициенты находят путем возведения в квадрат частных коэффициентов корреляции: *множественные коэффициенты детерминации; *коэффициенты множественной корреляции; * частные коэффициенты детерминации. 34. Какие типы данных используются в R: *logical *numeric *integer *attributive *complex * character 35. Какой вид диаграмм можно использовать при большом количестве данных, необходимости отображения динамики изменения данных во времени: *Циклическая гистограмма *Круговая диаграмма * График 36. Какой вид связи изображен на рис 1.. *обратно пропорциональная связь *вязь отсутствует *прямо пропорциональная связь *связь нелинейная 37. Какой пакет позволяет загружать данные из листа Excel файла? *readxl * excelreadr *googlesheets *vroom *sheets_read 38. Какой пакет позволяет загружать данные из листа Excel файла? *readxl * excelreadr *googlesheets *vroom *sheets_read 39. Классификация относится к стратегии: * обучения с учителем *обучения без учителя *обучения с подкреплением 40. Кластер можно охарактеризовать как … *группу объектов, имеющих общие свойства *один объект, изолированный от других *группу объектов, имеющую внутреннюю однородность 41. Корреляционное отношение изменяется в пределах *от -1 до +1 * от 0 до +1 *от 0 до -1 *от -2 до +2 42. Коэффициент вариации определяется по формуле: *1 *2 * 3 *4 43. Кто создал первую модель искусственных нейронных сетей? *Фрэнк Розенблатт * Уоррен Мак-Каллок и Уолтер Питтс *Ян Лекун *Дэвид И. Румельхарт, Дж. Е. Хинтон и Рональд Дж. Вильямс 44. Метод наименьших квадратов может применяться в случае *только парной регрессии *только множественной регрессии * нелинейной и линейной множественной регрессии *коллинеарной регрессии 45. На какой вкладке размещены инструменты сортировки в Microsoft Excel: *Вставка *Вид * Данные 46. Найдите соответствие между функцией в R и еe описанием: A. str(оbject) B. summаry(оbject) C. hеad(x) D. tаil(x) E. Внутренняя структура объекта F. Общая информация об объекте G. Посмотреть начальные строки объекта H. Посмотреть последние строки объекта
СКАЧАТЬ
|
|
| |
engineerklub | Дата: Пятница, 10.11.2023, 16:39 | Сообщение # 4 |
Генералиссимус
Группа: Администраторы
Сообщений: 28530
Статус: Offline
| 47. Найдите соответствие между функцией в R и еe описанием: A. с(…) B. sеq(from, to, by=) C. list(…) D. сbind(…) E. Объединяет аргументы в вектор F. Генерирует последовательность чисел с шагом G. Создает список объектов H. Объединяет объекты по столбцам 48. Не верно утверждение о том, что: *Большие объёмы данных приводят к слабой их структуризации, поэтому появляется такое разнообразие данных *Увеличившаяся производительность телекоммуникационных каналов привела к росту объёмов передаваемой информации *Удешевление систем хранения на единицу информации привело к росту рынка больших данных *Большое разнообразие источников данных 49. Не верно утверждение о том, что: * Большие данные это данные объёма свыше 1 Тб. *Проблема больших данных это проблема, когда при существующих технологиях хранения и обработки сущностная обработка данных затруднена или невозможна. *Большие данные - это тренд в области ИТ, подогреваемый маркетинговыми кампаниями крупных вендоров. *Большие данные как правило не структурированы. 50. Не верно, что Variety в контексте характеристик Big Data означает: * Высокая скорость генерирования данных * Разные типы данных в колонках таблиц реляционных СУБД * Разнообразие отраслей, являющихся источниками данных *Разнообразие типов данных, включающих в себя структурированные, полуструктурированные и неструктурированные 51. Не верно, что закономерности, определенные с использованием технологии Data Mining должны обладать такими свойствами: * быть очевидными *быть неочевидными * быть практически полезными *быть объективными 52. Не верно, что технология Web Mining применяет Data Mining для анализа: *Неоднородной информации *Неструктурированной информации *Структурированной информации *Распределенной и значительной по объему информации 53. Некоррелированность случайных величин означает *отсутствие любой связи между ними * отсутствие линейной связи между ними *их независимость 54. Объём накопленных человечеством цифровых данных на 2023 год измеряется: *Петабайтами *Зеттабайтами *Экзабайтами *Йоттабайтами 55. Один из объектов любой диаграммы: *Границы диаграммы * Область диаграммы *Очертания диаграммы 56. Один из объектов любой диаграммы: *Сущность диаграммы *Вид диаграммы * Название диаграммы 57. Один из объектов любой диаграммы: *Ось периодичности * Ось категорий *Ось постоянства 58. Один из объектов любой диаграммы: *Ось движений * Ось значений *Ось понятий 59. Определите правильную последовательность термина «Big Data»: 1цифровой информации 2быстро поступающей 3неоднородной 4огромные объемы 5которые 6традиционными 7невозможно 8обработать 9инструментами 60. Отметьте значимые события, повлиявшие на формирование тренда больших данных: * разработка Hadoop; * изобретение принципа MapReduce; *разработка языка Pyhton; *победа Deepblue в матче с Г.Каспаровым. 61. Переменная измерена в номинальной шкале, а переменная - в количественной шкале. Требуется выяснить, являются ли эти переменные независимыми. Для того чтобы решить эту задачу, можно * преобразовать переменную в номинальную переменную и применить критерий хи-квадрат *преобразовать переменную в количественную переменную и применить критерий для проверки *независимости количественных переменных *применить критерий Колмогорова-Смирнова 62. При проверки гипотезы о виде распределения используется * критерий Пирсона *критерий Фишера *критерий Лапласа *критерий Романовского 63. Признаки и измерены в количественной шкале. Требуется выяснить, являются ли эти переменные независимыми. Для того чтобы решить эту задачу, можно * преобразовать обе переменные в номинальные переменные и применить критерий хи-квадрат * преобразовать обе переменные в порядковые переменные и применить ранговый критерий Спирмена *применить критерий Колмогорова-Смирнова 64. Признаки и измерены в номинальной шкале. Какой критерий можно применить для проверки гипотезы о независимости этих признаков? *ранговый критерий Спирмена *ранговый критерий Кендэла * критерий хи-квадрат Фишера-Пирсона *критерий, основанный на выборочном коэффициенте корреляции 65. Регрессионный и дискриминантный анализ относятся… *к статистическим методам Data mining *к кибернетическим методам Data mining *не являются методами Data mining
СКАЧАТЬ
|
|
| |
engineerklub | Дата: Пятница, 10.11.2023, 16:40 | Сообщение # 5 |
Генералиссимус
Группа: Администраторы
Сообщений: 28530
Статус: Offline
| 66. Сколько наблюдений во фрейме данных, если он содержит 42 строки и 4 колонки? * 168 *4 *42 *126 67. Сколько наблюдений во фрейме данных, если он содержит 42 строки и 4 колонки? * 168 *4 *42 *126 68. Сколько Петабайт в Зеттабайте 69. Сто (100) студентов прошли тестирование по математическому анализу и по физике. Пусть переменная Х- рейтинг студентов по математическому анализу, а переменная Y- рейтинг по физике. Коэффициент корреляции Спирмена для переменных и оказался равным 0.6. Эта информация * позволяет на уровне значимости 0.05 сделать вывод о том, что между показателями и существует монотонная положительная связь *позволяет на уровне значимости 0.05 сделать вывод о том, что между показателями и существует монотонная отрицательная связь *позволяет сделать вывод о том, что на уровне значимости 0.05 нет оснований для отклонения гипотезы о независимости показателей и *не позволяет сделать вывод о зависимости или независимости показателей и 70. Табличные процессоры позволяют строить: *Теоретические гистограммы * Гистограммы *Практические гистограммы 71. Табличные процессоры позволяют строить: * Графики *Планы *Перспективные диаграммы 72. Табличные процессоры позволяют строить: *Линейные диаграммы *Линейчатые диаграммы *Частичные диаграммы 73. Такие данные как температура воздуха относятся к … *атрибутивным данным *непрерывным данным *дискретным данным *альтернативным данным 74. Укажите фактор(ы), способствовавший появлению тренда больших данных: *маркетинговые кампании крупных корпораций; *снижение издержек на хранение данных; *появление новых технологий обработки потоковых данных; *выпуск баз данных с обработкой данных в памяти. 75. Услуги по построению архитектуры системы базы данных, обустройству и оптимизации инфраструктуры, и обеспечению безопасности хранения данных относятся к … 76. Установите соответствие между функциями и их определениями: A. mutate_at B. transmute C. mutate D. изменяет определенные переменные по имени E. добавляет новые переменные во фрейм данных и удаляет существующие переменные F. добавляет новые переменные во фрейм данных, сохраняя существующие переменные 77. Целесообразно использовать диаграммы типа график: * Когда количество данных в наборе достаточно большое *Когда нужно показать изменения данных с течением времени *Когда нужно отобразить части одного целого 78. Что целесообразно создавать при необходимости сравнения значений нескольких наборов данных: *Поверхностную диаграмму *Графики * Гистограммы 79. Установите соответствие целей инфраструктуры Hadoop и их определений: A. Надежность B. Отказоустойчивость C. Масштабируемость D. Портируемость E. достигается посредством создания нескольких копий данных и повторного применения логики обработки в случае сбоя F. обнаружение сбоев и их автоматическое и применение автоматического восстановления G. данные и их обработка распределяются в кластерах H. возможность установки на всех видах устройств и операционных систем 80. Найдите соответствие между понятием и его описанием A. Data lake B. Data science C. Data mining D. Machine learning E. Хранилище больших данных в необработанном виде. F. Дисциплина, изучающая проблемы анализа, обработки и представления информации в цифровой форме. G. Интеллектуальный анализ данных с целью выявления закономерностей. H. Теория и практика разработки самообучающихся программ, большая область искусственного интеллекта.
СКАЧАТЬ
|
|
| |