[2015-05-31: obsoleto. Agora, procura-se ^$ e troca-se por nada (com “expressões regulares” ligada).]
É muito comum eu me deparar com arquivos-texto “planos”, isto é, sem formatação. Neste tipo de texto, cada linha termina com os caracteres de fim-de-parágrafo. Cada parágrafo é demarcado com dois fins-de-parágrafo seguidos.
Quando se importa este tipo de texto para um processador de texto, para fazer uma editoração mais elaborada, é necessário se tirar todos os parágrafos extra.
Durante anos tentei fazer isto com o OpenOffice (BR Office). O Help não me ajudava muito. Finalmente, descobri o pulo do gato no Rau-Tu openoffice. Muito mais simples do que eu imaginava.
A gente tem que procurar (CTRL+F) por “$” e fazer a troca por nada, com a opção “Expressões regulares” ligada. Pois o “$” é uma destas tais expressões regulares que significam o final de parágrafo.
Mas não se pode trocar diretamente todos os fins de parágrafo falsos por nada. Caso contrário, perderíamos as marcações de fins-de-parágrafo verdadeiras. Para trocar todos os fins-de-parágrafo falsos por verdadeiros, então se faz o seguinte:
- Troca-se temporariamente todos os parágrafo vazios (procure por ^$) por algo como ####PARAGRAFO####.
- Apaga-se todos os fins-de-parágrafo (troca-se $ por espaço). Isto irá juntas todos os parágrafos num único imenso paragrafão.
- Troca-se todos os ####PARAGRAFO#### por fim-de-parágrafo (“\n”). Isso irá inserir uma quebra de parágrafo onde realmente existia, no texto original.
- Troca-se eventuais espaços duplos por espaço simples.
- Troca-se, eventualmente, hífens e espaço por nada, para eliminar a hifenização de palavras.
nao deu certo. meu BROFFICE nao reconhece o cifrão $ como parágrafo mesmo com o botão expressões regulares selecionados.
no word o símbolo seria “^p”
Paulo, você tem que ativar a opção “expressões regulares” pra que o editor reconheça os caracteres especiais.
Muito obrigado. Sua dica foi excelente.
Felicidades
Valeu pelo prestígio, Wellington!