Función de incerteza
Supongamos un experimento o situación que, primero, no se ha realizado antes, o segundo, sus resultados tienen un carácter aleatorio. Al realizar el experimento, se obtiene un resultado, proporcionando una cantidad de información.
Esta cantidad de información depende de:
- El número de posibles resultados. Más posibles resultados → Más información.
- La probabilidad de obtener ese resultado. Más improbable → Más información.
Considerando la incerteza como la falta de certeza ante un experimento así, la cantidad de información que se obtiene tras realizar el experimento es igual a la cantidad de incerteza antes de hacerlo.
Denominamos a la incerteza sobre resultados posibles i equiprobables.
Los requisitos para la función de incerteza son:
Medida de Hartley
En 1928, Hartley propuso cumpliendo con los anteriores requisitos, pero no se tienen en cuenta las probabilidades de cada resultado si son distintas.
Medida de Shannon
Si los eventos menos probables dan más información, entonces la información debe crecer respecto a la inversa de las probabilidades, que se traduce como donde es una función creciente, y es un evento con una probabilidad .
En 1948, Shannon propuso la siguiente expresión como medida de la incerteza de un evento con una probabilidad :
Esta formula coincide con la medida de Hartley cuando los eventos son equiprobables.
Información de una fuente
Una fuente es todo aquello que emite mensajes, por ejemplo, una fuente podría ser un ordenador y los archivos son los mensajes. La fuente es en sí un conjunto finito de mensajes, con todos los posibles mensajes que puede emitir.
Si una fuente de información produce unos símbolos con las respectivas probabilidades , la información asociada a cada uno de los símbolos dependerá de su probabilidad.
Teniendo en cuenta que la cantidad de información (posterior) es igual a la cantidad de incerteza (anterior), definimos la información de la fuente como la media ponderada de la información de todos los símbolos:
Además coincide con la incerteza media que se tiene del resultado.
Unidades de medida de la información
Se denomina bit a la unidad de información más pequeña, asociada a dos eventos equiprobables .