Tirar fim-de-parágrafo de arquivos TXT com BROffice

[2015-05-31: obsoleto. Agora, procura-se ^$ e troca-se por nada (com “expressões regulares” ligada).]

É muito comum eu me deparar com arquivos-texto “planos”, isto é, sem formatação. Neste tipo de texto, cada linha termina com os caracteres de fim-de-parágrafo. Cada parágrafo é demarcado com dois fins-de-parágrafo seguidos.

Quando se importa este tipo de texto para um processador de texto, para fazer uma editoração mais elaborada, é necessário se tirar todos os parágrafos extra.

Durante anos tentei fazer isto com o OpenOffice (BR Office). O Help não me ajudava muito. Finalmente, descobri o pulo do gato no Rau-Tu openoffice. Muito mais simples do que eu imaginava.

A gente tem que procurar (CTRL+F) por “$” e fazer a troca por nada, com a opção “Expressões regulares” ligada. Pois o “$” é uma destas tais expressões regulares que significam o final de parágrafo.

Mas não se pode trocar diretamente todos os fins de parágrafo falsos por nada. Caso contrário, perderíamos as marcações de fins-de-parágrafo verdadeiras. Para trocar todos os fins-de-parágrafo falsos por verdadeiros, então se faz o seguinte:

  1. Troca-se temporariamente todos os parágrafo vazios (procure por ^$) por algo como ####PARAGRAFO####.
  2. Apaga-se todos os fins-de-parágrafo (troca-se $ por espaço). Isto irá juntas todos os parágrafos num único imenso paragrafão.
  3. Troca-se todos os ####PARAGRAFO#### por fim-de-parágrafo (“\n”). Isso irá inserir uma quebra de parágrafo onde realmente existia, no texto original.
  4. Troca-se eventuais espaços duplos por espaço simples.
  5. Troca-se, eventualmente, hífens e espaço por nada, para eliminar a hifenização de palavras.

About José Antonio Meira da Rocha

Jornalista, professor das áreas de Editoração e de Mídias Digitais na Universidade Federal de Santa Maria, campus cidade de Frederico Westphalen, Rio Grande do Sul, Brasil. Doutor em Design pelo Programa de Pós-Graduação em Design (PGDesign)/Universidade Federal do Rio Grande do Sul (UFRGS), Porto Alegre, Brasil, 2023. Mestre em Mídias pela UNISINOS, São Leopoldo, RS, Brasil, 2003. Especialista em Informática na Educação, Unisinos, 1976.