| engineerklub | Дата: Суббота, 21.06.2025, 06:44 | Сообщение # 1 |
 Генералиссимус
Группа: Администраторы
Сообщений: 36547
Статус: Offline
| Теория Информации. ДО СИБГУТИ 2025
Тип работы: Работа Лабораторная Форматы файлов: Microsoft Word, C++ Сдано в учебном заведении: ДО СИБГУТИ
Описание: Все работы успешно зачтены, вам необходимо лишь подписать
Комментарии: Лабораторная работа №1 "Вычисление энтропии Шеннона" Задание: 1. Для выполнения этой практической работы необходимо иметь три файла. Объем каждого файла больше 10 Кб, формат txt. В первом файле должна содержаться последовательность символов (количество различных символов больше 3) с равномерным распределением, т.е. символы в файле встречаются равновероятно и независимо. Второй файл должен содержать независимую последовательность символов (количество различных символов больше 3) с неравновероятным распределением. Вероятности символов должны быть заданы заранее, до создания файла. Эти два файла необходимо сгенерировать программно, используя генератор псевдослучайных чисел. В третьем файле содержится фрагмент художественного текста на русском или английском языке. Для художественных текстов (русский или английский языки) предполагается, что строчные и заглавные символы не отличаются, знаки препинания объединены в один символ, к алфавиту добавлен пробел, для русских текстов буквы «е» и «ё», «ь» и «ъ» совпадают. При использовании текста программы учитываются все символы, кроме знаков табуляции. 2. Составить программу, определяющую оценки энтропии имеющихся текстовых файлов. Для вычисления оценки энтропии необходимо программно вычислить частоты символов (пар символов) в файле, которые будут оценками реальных вероятностей символов, а затем, используя формулу Шеннона, вычислить оценки энтропии файла. 3. После тестирования программы необходимо заполнить таблицу для отчета и проанализировать полученные результаты. Сравните полученные оценки между собой. Объясните полученные результаты Оценка энтропии (частоты отдельных символов) Оценка энтропии (частоты пар символов) Теоретическое значение энтропии Файл 1 Файл 2 фрагмент художественного произведения
Лабораторная работа №2 Оптимальное побуквенное кодирование Цель работы: Изучение метода оптимального кодирования Хаффмана. Среда программирования: любая с С-подобным языком программирования. Результат: программа, тестовые примеры, отчет. Задание: 1. Запрограммировать процедуру двоичного кодирования текстового файла методом Хаффмана. Текстовые файлы использовать те же, что и в практической работе №1. Для художественных текстов (русский или английский языки) предполагается, что строчные и заглавные символы не отличаются, знаки препинания объединены в один символ, к алфавиту добавлен пробел, для русских текстов буквы «е» и «ё», «ь» и «ъ» совпадают. 2. Проверить, что полученный код является префиксным. 3. После кодирования текстового файла вычислить оценки энтропии выходной последовательности, используя частоты отдельных символов, пар символов и троек символов. 4. Заполнить таблицу и проанализировать полученные результаты.
СКАЧАТЬ
|
| |
|
|
| engineerklub | Дата: Суббота, 21.06.2025, 06:44 | Сообщение # 2 |
 Генералиссимус
Группа: Администраторы
Сообщений: 36547
Статус: Offline
| Метод кодирования Название текста Оценка избыточности кодирования Оценка энтропии выходной посл-ти (частоты символов) Оценка энтропии выходной посл-ти (частоты пар символов) Оценка энтропии выходной посл-ти (частоты троек символов) Метод Хаффмана Файл 1 Файл 2 фрагмент художественного произведения
Избыточность кодирования определяется как , где H – энтропия текста, Lcp – средняя длина кодового слова.
Лабораторная работа №3 Методы почти оптимального кодирования Цель работы: Изучение метода почти оптимального кодирования Фано. Изучение метода почти оптимального кодирования Шеннона Среда программирования: любая с С-подобным языком программирования. Результат: программа, тестовые примеры, отчет. Задание: 1. Запрограммировать процедуры двоичного кодирования текстового файла методом Фано и процедуру двоичного кодирования текстового файла методом Шеннона. Текстовые файлы использовать те же, что и в практической работе №1. Для художественных текстов (русский или английский языки) предполагается, что строчные и заглавные символы не отличаются, знаки препинания объединены в один символ, к алфавиту добавлен пробел, для русских текстов буквы «е» и «ё», «ь» и «ъ» совпадают. 2. Проверить, что полученные коды являются префиксными. 3. Для каждого метода кодирования после кодирования вычислить оценки энтропии выходной последовательности, используя частоты отдельных символов, пар символов и тройки символов. 4. После тестирования программы необходимо заполнить таблицу и проанализировать полученные результаты.
Метод кодирования Файлы Оценка избыточности кодирования Оценка энтропии выходной посл-ти (частоты символов) Оценка энтропии выходной посл-ти (частоты пар символов) Оценка энтропии выходной посл-ти (частоты троек символов) Метод Хаффмана Файл 1 Файл 2 фрагмент художественного произведения Метод Фано Файл 1 Файл 2 фрагмент художественного произведения Метод Шеннона Файл 1 Файл 2 фрагмент художественного произведения
Избыточность кодирования определяется как , где H – энтропия текста, Lcp – средняя длина кодового слова.
СКАЧАТЬ
|
| |
|
|