Воскресенье, 24.11.2024, 00:49
Приветствую Вас, Гость
[ Новые сообщения · Участники · Правила форума · Поиск · RSS ]
  • Страница 1 из 1
  • 1
Программирование графических процессоров. Вариант 2
engineerklubДата: Понедельник, 22.07.2024, 08:00 | Сообщение # 1
Генералиссимус
Группа: Администраторы
Сообщений: 28524
Репутация: 0
Статус: Offline
Программирование графических процессоров. Вариант 2

Тип работы: Работа Контрольная
Форматы файлов: Microsoft Word
Сдано в учебном заведении: ДО СИБГУТИ

Описание:
Задание 1.
Дана спецификация графического процессора:
1. Максимальное число варпов на мультипроцессор: 64
2. Максимальное число блоков на мультипроцессор: 32
3. Максимальное количество 32-х битных регистров на мультипроцессор: 65536
4. Максимальное количество 32-х битных регистров на блок: 65536
5. Максимальное количество 32-х битных регистров на нить: 255
6. Размер разделяемой памяти мультипроцессора (байт): 65536
7. Размер разделяемой памяти блока (байт): 49152
Параметры запускаемой программы:
1. Размер блока: 128
2. Разделяемая память на блок (байт): 5000
3. 32-х битных регистров на нить: 10
Рассчитайте теоретическую заполняемость. Чем она ограничена?

Задание 2.
Пусть разделяемая память мультипроцессора поделена на 4-х байтовые слова, и каждое слово по порядку пронумеровано от 1 до N. К словам обращаются нити одного варпа. Нити варпа пронумерованы от 0 до 31. В таблице ниже указано какая нить к какому 4-х байтовому слову обращается.
Номер нити Номер слова
0 1
1 2
2 3
3 4
4 5
5 6
6 7
7 8
8 9
9 10
10 11
11 12
12 13
13 14
14 15
15 16
16 17
17 18
18 19
19 20
20 21
21 22
22 23
23 24
24 25
25 26
26 27
27 28
28 29
29 30
30 31
31 32
Рассчитайте степень конфликта банков данных в данном доступе к разделяемой памяти?

Задание 3.
Реализуйте параллельный алгоритм умножения матриц с использованием технологии CUDA с использованием разделяемой памяти. Проанализируйте, реализованный алгоритм с точки зрения эффективности доступа к разделяемой памяти.

СКАЧАТЬ
 
  • Страница 1 из 1
  • 1
Поиск:

Рейтинг@Mail.ru