Теория Информации. ДО СИБГУТИ 2025

ВСЁ ДЛЯ СТУДЕНТА

Вторник, 09.06.2026, 17:59

Приветствую Вас, Гость

[ Новые сообщения · Участники · Правила форума · Поиск · RSS ]

Страница 1 из 1
1

Теория Информации. ДО СИБГУТИ 2025 (Работа Лабораторная)

Теория Информации. ДО СИБГУТИ 2025

engineerklub

Дата: Суббота, 21.06.2025, 06:44 | Сообщение # 1

Генералиссимус

Группа: Администраторы

Сообщений: 39247

Репутация: 1

Статус: Offline

Теория Информации. ДО СИБГУТИ 2025

Тип работы: Работа Лабораторная
Форматы файлов: Microsoft Word, C++
Сдано в учебном заведении: ДО СИБГУТИ

Описание:
Все работы успешно зачтены, вам необходимо лишь подписать

Комментарии: Лабораторная работа №1 "Вычисление энтропии Шеннона"
Задание:
1. Для выполнения этой практической работы необходимо иметь три файла. Объем каждого файла больше 10 Кб, формат txt.
В первом файле должна содержаться последовательность символов (количество различных символов больше 3) с равномерным распределением, т.е. символы в файле встречаются равновероятно и независимо.
Второй файл должен содержать независимую последовательность символов (количество различных символов больше 3) с неравновероятным распределением. Вероятности символов должны быть заданы заранее, до создания файла.
Эти два файла необходимо сгенерировать программно, используя генератор псевдослучайных чисел.
В третьем файле содержится фрагмент художественного текста на русском или английском языке. Для художественных текстов (русский или английский языки) предполагается, что строчные и заглавные символы не отличаются, знаки препинания объединены в один символ, к алфавиту добавлен пробел, для русских текстов буквы «е» и «ё», «ь» и «ъ» совпадают. При использовании текста программы учитываются все символы, кроме знаков табуляции.
2. Составить программу, определяющую оценки энтропии имеющихся текстовых файлов.
Для вычисления оценки энтропии необходимо программно вычислить частоты символов (пар символов) в файле, которые будут оценками реальных вероятностей символов, а затем, используя формулу Шеннона, вычислить оценки энтропии файла.
3. После тестирования программы необходимо заполнить таблицу для отчета и проанализировать полученные результаты. Сравните полученные оценки между собой. Объясните полученные результаты
Оценка энтропии
(частоты отдельных символов) Оценка энтропии
(частоты пар символов) Теоретическое значение энтропии
Файл 1
Файл 2
фрагмент художественного произведения

Лабораторная работа №2
Оптимальное побуквенное кодирование
Цель работы: Изучение метода оптимального кодирования Хаффмана.
Среда программирования: любая с С-подобным языком программирования.
Результат: программа, тестовые примеры, отчет.
Задание:
1. Запрограммировать процедуру двоичного кодирования текстового файла методом Хаффмана. Текстовые файлы использовать те же, что и в практической работе №1. Для художественных текстов (русский или английский языки) предполагается, что строчные и заглавные символы не отличаются, знаки препинания объединены в один символ, к алфавиту добавлен пробел, для русских текстов буквы «е» и «ё», «ь» и «ъ» совпадают.
2. Проверить, что полученный код является префиксным.
3. После кодирования текстового файла вычислить оценки энтропии выходной последовательности, используя частоты отдельных символов, пар символов и троек символов.
4. Заполнить таблицу и проанализировать полученные результаты.

СКАЧАТЬ

engineerklub

Дата: Суббота, 21.06.2025, 06:44 | Сообщение # 2

Генералиссимус

Группа: Администраторы

Сообщений: 39247

Репутация: 1

Статус: Offline

Метод
кодирования Название текста Оценка
избыточности кодирования Оценка энтропии выходной посл-ти (частоты символов) Оценка энтропии выходной посл-ти (частоты пар символов) Оценка энтропии выходной посл-ти (частоты троек символов)
Метод Хаффмана Файл 1
Файл 2
фрагмент художественного произведения

Избыточность кодирования определяется как , где H – энтропия текста, Lcp – средняя длина кодового слова.

Лабораторная работа №3
Методы почти оптимального кодирования
Цель работы: Изучение метода почти оптимального кодирования Фано. Изучение метода почти оптимального кодирования Шеннона
Среда программирования: любая с С-подобным языком программирования.
Результат: программа, тестовые примеры, отчет.
Задание:
1. Запрограммировать процедуры двоичного кодирования текстового файла методом Фано и процедуру двоичного кодирования текстового файла методом Шеннона. Текстовые файлы использовать те же, что и в практической работе №1. Для художественных текстов (русский или английский языки) предполагается, что строчные и заглавные символы не отличаются, знаки препинания объединены в один символ, к алфавиту добавлен пробел, для русских текстов буквы «е» и «ё», «ь» и «ъ» совпадают.
2. Проверить, что полученные коды являются префиксными.
3. Для каждого метода кодирования после кодирования вычислить оценки энтропии выходной последовательности, используя частоты отдельных символов, пар символов и тройки символов.
4. После тестирования программы необходимо заполнить таблицу и проанализировать полученные результаты.

Метод
кодирования Файлы Оценка
избыточности кодирования Оценка энтропии выходной посл-ти (частоты символов) Оценка энтропии выходной посл-ти (частоты пар символов) Оценка энтропии выходной посл-ти (частоты троек символов)
Метод Хаффмана Файл 1
Файл 2
фрагмент художественного произведения
Метод Фано Файл 1
Файл 2
фрагмент художественного произведения
Метод Шеннона Файл 1
Файл 2
фрагмент художественного произведения

Избыточность кодирования определяется как , где H – энтропия текста, Lcp – средняя длина кодового слова.

СКАЧАТЬ

Теория Информации. ДО СИБГУТИ 2025 (Работа Лабораторная)

Страница 1 из 1
1