engineerklub | Дата: Понедельник, 07.07.2025, 12:56 | Сообщение # 1 |
 Генералиссимус
Группа: Администраторы
Сообщений: 34258
Статус: Offline
| Программирование графических процессоров. Вариант 8
Тип работы: Работа Контрольная Форматы файлов: Microsoft Word Сдано в учебном заведении: ДО СИБГУТИ
Описание: Расчет номера варианта
Чтобы выбрать вариант контрольной работы нужно посчитать хеш-функцию от своего полного имени, фамилии (если есть) и отчества (если есть). Хеш-функция представляет собой остаток от деления на двадцать суммы порядковых номеров букв русского алфавита, составляющих ваши ФИО. К остатку в конце прибавляется единица. Нумерация букв алфавита: А=1, Б=2, В=3, Г=4, Д=5, Е=6, Ё=7, Ж=8, З=9, И=10, Й=11, К=12, Л=13, М=14, Н=15, О=16, П=17, Р=18, С=19, Т=20, У=21, Ф=22, Х=23, Ц=24, Ч=25, Ш=26, Щ=27, Ъ=28, Ы=29, Ь=30, Э=31, Ю=32, Я=33
Вариант 8
Задание 1. Дана спецификация графического процессора: 1. Максимальное число варпов на мультипроцессор: 32 2. Максимальное число блоков на мультипроцессор: 16 3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536 4. Максимальное количество 32-х битных регистров на блок: 65536 5. Максимальное количество 32-х битных регистров на нить: 255 6. Размер разделяемой памяти мультипроцессора (байт): 65536 7. Размер разделяемой памяти блока (байт): 49152 Параметры запускаемой программы: 1. Размер блока: 256 2. Разделяемая память на блок (байт): 20000 1. 32-х битных регистров на нить: 64 Рассчитайте теоретическую заполняемость? Чем она ограничена?
Задание 2. Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается. Номер нити Номер слова 0 32 1 64 2 128 3 256 4 32 5 64 6 128 7 256 8 32 9 64 10 128 11 256 12 32 13 64 14 128 15 256 16 32 17 64 18 128 19 256 20 32 21 64 22 128 23 256 24 32 25 64 26 128 27 256 28 32 29 64 30 128 31 256
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
Задание 3. Реализуйте параллельный алгоритм умножения матриц с использованием технологии CUDA с использованием разделяемой памяти. Примените к решению задачи потоки. Реализуйте последовательный алгоритм умножения матриц. Сравните скорость выполнения алгоритмов на данных разных размеров, рассчитайте коэффициент ускорения.
СКАЧАТЬ
|
|
| |