Суббота, 26.07.2025, 15:21
Приветствую Вас, Гость
[ Новые сообщения · Участники · Правила форума · Поиск · RSS ]
  • Страница 1 из 1
  • 1
Программирование графических процессоров. Вариант 14
engineerklubДата: Вторник, 01.07.2025, 05:33 | Сообщение # 1
Генералиссимус
Группа: Администраторы
Сообщений: 34253
Репутация: 0
Статус: Offline
Программирование графических процессоров. Вариант 14

Тип работы: Работа Контрольная
Форматы файлов: Microsoft Word
Сдано в учебном заведении: ДО СИБГУТИ

Описание:
Задание 1.
Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 16
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 32768
7. Размер разделяемой памяти блока (байт): 24576
Параметры запускаемой программы:
1. Размер блока: 721
2. Разделяемая память на блок (байт): 4500
1. 32-х битных регистров на нить: 15
Рассчитайте теоретическую заполняемость? Чем она ограничена?

Задание 2.
Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 28
1 63
2 125
3 252
4 1
5 31
6 61
7 93
8 126
9 157
10 190
11 222
12 28
13 61
14 125
15 252
16 29
17 61
18 124
19 253
20 509
21 1020
22 2045
23 4093
24 253
25 286
26 318
27 349
28 382
29 414
30 445
31 478

Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?

Задание 3.
Реализуйте два параллельных алгоритма умножения матриц, первый подразумевает стандартный способ хранения и доступа к элементам матриц в линейной памяти, второй подразумевает, что вторая матрица хранится в транспонированном виде. Для оптимизации алгоритмов примените разделяемую память. Сравните время выполнения алгоритмов на разных размерах данных.

СКАЧАТЬ
 
  • Страница 1 из 1
  • 1
Поиск:

Рейтинг@Mail.ru