Tirar fim-de-parágrafo de arquivos TXT com BROffice

[2015-05-31: obsoleto. Agora, procura-se ^$ e troca-se por nada (com “expressões regulares” ligada).]

É muito comum eu me deparar com arquivos-texto “planos”, isto é, sem formatação. Neste tipo de texto, cada linha termina com os caracteres de fim-de-parágrafo. Cada parágrafo é demarcado com dois fins-de-parágrafo seguidos.

Quando se importa este tipo de texto para um processador de texto, para fazer uma editoração mais elaborada, é necessário se tirar todos os parágrafos extra.

Durante anos tentei fazer isto com o OpenOffice (BR Office). O Help não me ajudava muito. Finalmente, descobri o pulo do gato no Rau-Tu openoffice. Muito mais simples do que eu imaginava.

A gente tem que procurar (CTRL+F) por “$” e fazer a troca por nada, com a opção “Expressões regulares” ligada. Pois o “$” é uma destas tais expressões regulares que significam o final de parágrafo.

Mas não se pode trocar diretamente todos os fins de parágrafo falsos por nada. Caso contrário, perderíamos as marcações de fins-de-parágrafo verdadeiras. Para trocar todos os fins-de-parágrafo falsos por verdadeiros, então se faz o seguinte:

  1. Troca-se temporariamente todos os parágrafo vazios (procure por ^$) por algo como ####PARAGRAFO####.
  2. Apaga-se todos os fins-de-parágrafo (troca-se $ por espaço). Isto irá juntas todos os parágrafos num único imenso paragrafão.
  3. Troca-se todos os ####PARAGRAFO#### por fim-de-parágrafo (“\n”). Isso irá inserir uma quebra de parágrafo onde realmente existia, no texto original.
  4. Troca-se eventuais espaços duplos por espaço simples.
  5. Troca-se, eventualmente, hífens e espaço por nada, para eliminar a hifenização de palavras.
José Antonio Meira da Rocha

Jornalista, professor das áreas de Editoração e de Mídias Digitais na Universidade Federal de Santa Maria, campus cidade de Frederico Westphalen, Rio Grande do Sul, Brasil. Doutor em Design pelo Programa de Pós-Graduação em Design (PGDesign)/Universidade Federal do Rio Grande do Sul (UFRGS), Porto Alegre, Brasil, 2023. Mestre em Mídias pela UNISINOS, São Leopoldo, RS, Brasil, 2003. Especialista em Informática na Educação, Unisinos, 1976.

View Comments

  • nao deu certo. meu BROFFICE nao reconhece o cifrão $ como parágrafo mesmo com o botão expressões regulares selecionados.
    no word o símbolo seria "^p"

    • Paulo, você tem que ativar a opção "expressões regulares" pra que o editor reconheça os caracteres especiais.

Recent Posts

Sempre faça um fotão

Colheita de soja. Foto: Wenderson Araujo/Trilux Fotógrafos de mídias rurais já perderam a conta das…

1 year ago

A corrupção dos tolos

João Batista MezzomoAuditor fiscal O que está por trás de tudo o que está acontecendo…

4 years ago

Naomi who? Naomi Wu!

A.k.a. "SexyCyborg". A mulher do século 21. Naomi Wu testa seu iluminador de implantes na…

5 years ago

Raspagem de dados

A principal ferramenta do jornalista de dados é a planilha, tipo LibreOffice Calc, M.S. Excel…

5 years ago

Que estratégia político-terapêutica pára um governo deliroide?

Rita Almeida, 9 de março de 2019 Psicóloga Rita Almeida: não delirantes, mas deliroides. Não…

6 years ago

Sua tia não é fascista, ela está sendo manipulada

Rafael Azzi5 de outubro de 2018 Você se pergunta como um candidato com tão poucas…

6 years ago