Среда, 14.01.2026, 16:29
Приветствую Вас, Гость
[ Новые сообщения · Участники · Правила форума · Поиск · RSS ]
  • Страница 1 из 1
  • 1
Теория Информации. ДО СИБГУТИ 2025
engineerklubДата: Суббота, 21.06.2025, 06:44 | Сообщение # 1
Генералиссимус
Группа: Администраторы
Сообщений: 36547
Репутация: 0
Статус: Offline
Теория Информации. ДО СИБГУТИ 2025

Тип работы: Работа Лабораторная
Форматы файлов: Microsoft Word, C++
Сдано в учебном заведении: ДО СИБГУТИ

Описание:
Все работы успешно зачтены, вам необходимо лишь подписать

Комментарии: Лабораторная работа №1 "Вычисление энтропии Шеннона"
Задание:
1. Для выполнения этой практической работы необходимо иметь три файла. Объем каждого файла больше 10 Кб, формат txt.
В первом файле должна содержаться последовательность символов (количество различных символов больше 3) с равномерным распределением, т.е. символы в файле встречаются равновероятно и независимо.
Второй файл должен содержать независимую последовательность символов (количество различных символов больше 3) с неравновероятным распределением. Вероятности символов должны быть заданы заранее, до создания файла.
Эти два файла необходимо сгенерировать программно, используя генератор псевдослучайных чисел.
В третьем файле содержится фрагмент художественного текста на русском или английском языке. Для художественных текстов (русский или английский языки) предполагается, что строчные и заглавные символы не отличаются, знаки препинания объединены в один символ, к алфавиту добавлен пробел, для русских текстов буквы «е» и «ё», «ь» и «ъ» совпадают. При использовании текста программы учитываются все символы, кроме знаков табуляции.
2. Составить программу, определяющую оценки энтропии имеющихся текстовых файлов.
Для вычисления оценки энтропии необходимо программно вычислить частоты символов (пар символов) в файле, которые будут оценками реальных вероятностей символов, а затем, используя формулу Шеннона, вычислить оценки энтропии файла.
3. После тестирования программы необходимо заполнить таблицу для отчета и проанализировать полученные результаты. Сравните полученные оценки между собой. Объясните полученные результаты
 Оценка энтропии
(частоты отдельных символов) Оценка энтропии
(частоты пар символов) Теоретическое значение энтропии
Файл 1     
Файл 2     
фрагмент художественного произведения   

Лабораторная работа №2
Оптимальное побуквенное кодирование
Цель работы: Изучение метода оптимального кодирования Хаффмана.
Среда программирования: любая с С-подобным языком программирования.
Результат: программа, тестовые примеры, отчет.
Задание:
1. Запрограммировать процедуру двоичного кодирования текстового файла методом Хаффмана. Текстовые файлы использовать те же, что и в практической работе №1. Для художественных текстов (русский или английский языки) предполагается, что строчные и заглавные символы не отличаются, знаки препинания объединены в один символ, к алфавиту добавлен пробел, для русских текстов буквы «е» и «ё», «ь» и «ъ» совпадают.
2. Проверить, что полученный код является префиксным.
3. После кодирования текстового файла вычислить оценки энтропии выходной последовательности, используя частоты отдельных символов, пар символов и троек символов.
4. Заполнить таблицу и проанализировать полученные результаты.

СКАЧАТЬ
 
engineerklubДата: Суббота, 21.06.2025, 06:44 | Сообщение # 2
Генералиссимус
Группа: Администраторы
Сообщений: 36547
Репутация: 0
Статус: Offline
Метод
кодирования Название текста Оценка
избыточности кодирования Оценка энтропии выходной посл-ти (частоты символов) Оценка энтропии выходной посл-ти (частоты пар символов) Оценка энтропии выходной посл-ти (частоты троек символов)
Метод Хаффмана Файл 1      
 Файл 2       
 фрагмент художественного произведения       

Избыточность кодирования определяется как , где H – энтропия текста, Lcp – средняя длина кодового слова.

Лабораторная работа №3
Методы почти оптимального кодирования
Цель работы: Изучение метода почти оптимального кодирования Фано. Изучение метода почти оптимального кодирования Шеннона
Среда программирования: любая с С-подобным языком программирования.
Результат: программа, тестовые примеры, отчет.
Задание:
1. Запрограммировать процедуры двоичного кодирования текстового файла методом Фано и процедуру двоичного кодирования текстового файла методом Шеннона. Текстовые файлы использовать те же, что и в практической работе №1. Для художественных текстов (русский или английский языки) предполагается, что строчные и заглавные символы не отличаются, знаки препинания объединены в один символ, к алфавиту добавлен пробел, для русских текстов буквы «е» и «ё», «ь» и «ъ» совпадают.
2. Проверить, что полученные коды являются префиксными.
3. Для каждого метода кодирования после кодирования вычислить оценки энтропии выходной последовательности, используя частоты отдельных символов, пар символов и тройки символов.
4. После тестирования программы необходимо заполнить таблицу и проанализировать полученные результаты.

Метод
кодирования Файлы Оценка
избыточности кодирования Оценка энтропии выходной посл-ти (частоты символов) Оценка энтропии выходной посл-ти (частоты пар символов) Оценка энтропии выходной посл-ти (частоты троек символов)
Метод Хаффмана Файл 1       
 Файл 2       
 фрагмент художественного произведения       
Метод Фано Файл 1       
 Файл 2       
 фрагмент художественного произведения       
Метод Шеннона Файл 1       
 Файл 2       
 фрагмент художественного произведения       

Избыточность кодирования определяется как , где H – энтропия текста, Lcp – средняя длина кодового слова.

СКАЧАТЬ
 
  • Страница 1 из 1
  • 1
Поиск:

Рейтинг@Mail.ru