Tirar fim-de-parágrafo de arquivos TXT com BROffice

É muito comum eu me deparar com arquivos-texto “planos”, isto é, sem formatação. Neste tipo de texto, cada linha termina com os caracteres de fim-de-parágrafo. Cada parágrafo é demarcado com dois fins-de-parágrafo seguidos.

Quando se importa este tipo de texto para um processador de texto, para fazer uma editoração mais elaborada, é necessário se tirar todos os parágrafos extra.

Durante anos tentei fazer isto com o OpenOffice (BR Office). O Help não me ajudava muito. Finalmente, descobri o pulo do gato no Rau-Tu openoffice. Muito mais simples do que eu imaginava.

A gente tem que procurar (CTRL+F) por “$” e fazer a troca por nada, com a opção “Expressões regulares” ligada. Pois o “$” é uma destas tais expressões regulares que significam o final de parágrafo.

Mas não se pode trocar diretamente todos os fins de parágrafo falsos por nada. Caso contrário, perderíamos as marcações de fins-de-parágrafo verdadeiras. Para trocar todos os fins-de-parágrafo falsos por verdadeiros, então se faz o seguinte:

  1. Troca-se temporariamente todos os parágrafo vazios (procure por ^$) por algo como ####PARAGRAFO####.
  2. Apaga-se todos os fins-de-parágrafo (troca-se $ por espaço). Isto irá juntas todos os parágrafos num único imenso paragrafão.
  3. Troca-se todos os ####PARAGRAFO#### por fim-de-parágrafo (“\n”). Isso irá inserir uma quebra de parágrafo onde realmente existia, no texto original.
  4. Troca-se eventuais espaços duplos por espaço simples.
  5. Troca-se, eventualmente, hífens e espaço por nada, para eliminar a hifenização de palavras.

Sobre José Antonio Rocha

Jornalista, professor de Planejamento Gráfico e Mídias Digitais da Universidade Federal de Santa Maria, campus da cidade de Frederico Westphalen, Rio Grande do Sul, Brasil.