engineerklub | Дата: Понедельник, 26.05.2025, 06:27 | Сообщение # 1 |
 Генералиссимус
Группа: Администраторы
Сообщений: 33467
Статус: Offline
| Теория информации. Вычисление энтропии Шеннона
Тип работы: Работа Лабораторная Сдано в учебном заведении: ДО СИБГУТИ
Описание: Вычисление энтропии Шеннона Цель работы: Экспериментальное изучение свойств энтропии Шеннона. Среда программирования: любая с С-подобным языком программирования. Результат: программа, тестовые примеры, отчет. Задание: 1. Для выполнения этой практической работы необходимо иметь три файла. Объем каждого файла больше 10 Кб, формат txt. В первом файле должна содержаться последовательность символов (количество различных символов больше 3) с равномерным распределением, т.е. символы в файле встречаются равновероятно и независимо. Второй файл должен содержать независимую последовательность символов (количество различных символов больше 3) с не равновероятным распределением. Вероятности символов должны быть заданы заранее, до создания файла. Эти два файла необходимо сгенерировать программно, используя генератор псевдослучайных чисел. В третьем файле содержится фрагмент художественного текста на русском или английском языке. Для художественных текстов (русский или английский языки) предполагается, что строчные и заглавные символы не отличаются, знаки препинания объединены в один символ, к алфавиту добавлен пробел, для русских текстов буквы «е» и «ё», «ь» и «ъ» совпадают. При использовании текста программы учитываются все символы, кроме знаков табуляции. 2. Составить программу, определяющую оценки энтропии имеющихся текстовых файлов. Для вычисления оценки энтропии необходимо программно вычислить частоты символов (пар символов) в файле, которые будут оценками реальных вероятностей символов, а затем, используя формулу Шеннона, вычислить оценки энтропии файла. По желанию можно продолжить процесс вычисления оценок с использованием частот троек, четверок символов и т.д. Для того чтобы правильно рассчитать частоты двойных комбинаций символов пары символов нужно рассматривать так Пусть имеется такая последовательность фывафпро Под парами понимаются пары соседних символов, т.е. фы ыв ва аф фп пр ро Далее для получения оценки энтропии подсчитать частоту встречаемости для каждой пары и подставить в формулу Шеннона. Полученное значение оценки энтропии следует разделить на 2. 3. После тестирования программы необходимо заполнить таблицу для отчета и проанализировать полученные результаты. Сравните полученные оценки между собой. Объясните полученные результаты
СКАЧАТЬ
|
|
| |