Publicidade
DescomplicômetroDicas

Descomplicômetro – Compressão de dados

A compressão de dados é um daqueles processos que toda a gente sabe que funciona, mas ninguém sabe... como funciona.

Compressão de dados

Se a Gillette é sinônimo de lâmina de barbear, ZIP é sinônimo de compressão de dados. Mas isso não invalida todas as restantes soluções de compressão que existem no mercado, especialmente tendo em conta que todas elas partilham algo em comum entre si, a impressionante capacidade de garantir que um arquivo com um determinado tamanho consiga ficar significativamente menor, por mera magia. É, porém, essa “magia” que queremos revelar para você. Este procedimento tornou-se tão popular que já vem incluído, de forma nativa, nos principais sistemas operativos do mercado: Windows e Mac OS.

Algoritmos

Você certamente já terá ouvido falar na palavra ‘algoritmos’. Para muitos, o desenvolvimento de um algoritmo poderá valer uma fortuna, se o mesmo conseguir funcionar conforme foi proposto, ou criado. No caso da compressão de dados, este algoritmo pega em pequenos dados, indexando-os, para eliminar repetições, tornando assim os ficheiros bem menores. Imagine um texto que diz: «Os leitores gostam da PCGuia. A PCGuia gosta dos leitores». Esta frase é constituída por dez palavras, sendo algumas delas repetidas. Utilizando um algoritmo de compressão, as palavras seriam indexadas, eliminando, assim, as repetidas.

O fato de terem sido indexadas permitiria recuperar as palavras eliminadas, para que não se perdessem quando fossem descomprimidas.
Ou seja, se atribuirmos um número às palavras, a frase acabaria por ficar 1 2 3 4 5 6 5 7 8 2. O 5 e o 2 aparecerem duas vezes, pois representaram as palavras repetidas ‘PCGuia e ‘leitores’. Como deve imaginar, um número é significativamente menor que uma palavra, razão pela qual a indexação é fundamental para que as palavras não se percam durante o processo de conversão e compactação.
Se cada palavra, espaço ou pontuação corresponderem a uma unidade, a frase original dispõe de 57 unidades, enquanto a frase indexada corresponde apenas a vinte, embora seja necessária a indexação para a recuperação sem perda da informação inicial.

Multimídia

No que diz respeito a conteúdos multimídia, a situação é parecida, embora a abordagem seja diferente, uma vez que existe perda de dados. No caso das imagens, por exemplo, o algoritmo de compressão elimina informações que considera irrelevantes, como diversas tonalidades de cores, idênticas a outras já existentes, como o azul do céu. Aqui, a maioria dos pixels com diversas referências de cor azul passa a usar a mesma referência, sem influenciar demasiado o resultado final. Isto acontece também com os vídeos, embora o resultado seja menos notório, já que cada fotograma só está visível durante um curto período, como 1/25 a 1/50 de segundo (nos casos de 25 e 50fps).

Já no caso do áudio, a situação é igual, sendo eliminadas partes do espectro sonoro que habitualmente não são captadas pelo ouvido humano. Esta solução, aplicada em formatos como o MP3 (embora implique ligeiras perdas na qualidade do som), permite reduzir a dimensão do ficheiro original para um décimo, algo que podemos considerar como uma solução mais do que justa.