Воскресенье, 24.11.2024, 15:47
Приветствую Вас, Гость
[ Новые сообщения · Участники · Правила форума · Поиск · RSS ]
  • Страница 1 из 1
  • 1
Программирование графических процессоров Вариант 10
engineerklubДата: Пятница, 01.09.2023, 13:38 | Сообщение # 1
Генералиссимус
Группа: Администраторы
Сообщений: 28530
Репутация: 0
Статус: Offline
Программирование графических процессоров Вариант 10 

Тип работы: Работа Контрольная
Сдано в учебном заведении: ДО СИБГУТИ

Описание:
2023 год
СибГУТИ
Сибирский государственный университет телекоммуникаций и информатики
Милешко Антон Владимирович
Тема: Контрольная работа Программирование графических процессоров Вариант 10 2023 год

Задания
Задание 1. Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 32
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры запускаемой программы:
1. Размер блока: 512
2. Разделяемая память на блок (байт): 20000
1. 32-х битных регистров на нить: 48
Рассчитайте теоретическую заполняемость? Чем она ограничена?
Задание 2. Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 32
1 64
2 128
3 256
4 1
5 33
6 65
7 97
8 129
9 161
10 193
11 225
12 32
13 64
14 128
15 256
16 32
17 64
18 128
19 256
20 512
21 1024
22 2048
23 4096
24 257
25 289
26 321
27 353
28 385
29 417
30 449
31 481
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?
Задание 3. Реализуйте два параллельных алгоритма умножения матриц с использованием технологии CUDA без использования разделяемой памяти. Первый алгоритм должен использовать стандартную схему умножения матриц, а второй должен подразумевать, что вторая матрица хранится в транспонированном виде. Сравните время работы алгоритмов, рассчитайте коэффициент ускорения.

СКАЧАТЬ
 
  • Страница 1 из 1
  • 1
Поиск:

Рейтинг@Mail.ru