você está aqui: Home  → Arquivo de Mensagens

htmlclean - limpeza do código html

Colaboração: Rubens Queiroz de Almeida

Data de Publicação: 30 de maio de 2014

O comando htmlclean oferece uma interface em linha de comando para o módulo HTML::Clean. Este módulo pode auxiliar na criação de código html mais compatível e menor. Desta forma, o tempo de resposta do seu site pode se tornar menor (menos bytes precisarão ser transmitidos para os clientes) e possivelmente você terá menos problemas de compatibilidade.

É claro que com isto o seu código html ficará menos legível, pois são feitas várias mudanças que reduzem a legibilidade do arquivo.

Da documentação do módulo HTML::Clean, estão disponíveis as seguintes otimizações no código html:

Diretiva Significado
whitespace espaços em branco excessivos são removidos
shortertags <strong> -> <b>, etc..
blink remove as tags blink
contenttype Remove default contenttype.
comments Remove comentários em excesso
entities &quot; -> ", etc.
dequote remove quotes das tags html quando possível
defcolor recodifica as cores de forma mais curta (#ffffff -> white, etc.)
javascript remove espaços em excesso e quebras de linha do código html
htmldefaults remove valores default de alguas tags html
lowercasetags traduz TODAS as tags para minúsculas

Estas diretivas não são passadas para o programa htmlclean, que por padrão assume que todas as modificações devem ser feitas.

A sintaxe do programa htmlclean é:

  htmlclean [-v] [-V] file1 [file2 file3 ...]

A opção -v exibe, ao final da "limpeza" do código html, o tamanho inicial, o tamanho final e a taxa de compressão obtida:

  % htmlclean -v index.html
    6462   4355 32% index.html

O programa htmlclean faz parte do pacote libhtml-clean-perl. Para instalar em sistemas Debian GNU/Linux e derivados, digitar:

  sudo apt-get install libhtml-clean-perl


Veja a relação completa dos artigos de Rubens Queiroz de Almeida