Design Gráfico, Diagramação, Editoração

Tirar fim-de-parágrafo de arquivos TXT com BROffice

É muito comum eu me deparar com arquivos-texto “planos”, isto é, sem formatação. Neste tipo de texto, cada linha termina com os caracteres de fim-de-parágrafo. Cada parágrafo é demarcado com dois fins-de-parágrafo seguidos.

Quando se importa este tipo de texto para um processador de texto, para fazer uma editoração mais elaborada, é necessário se tirar todos os parágrafos extra.

Durante anos tentei fazer isto com o OpenOffice (BR Office). O Help não me ajudava muito. Finalmente, descobri o pulo do gato no Rau-Tu openoffice. Muito mais simples do que eu imaginava.

A gente tem que procurar (CTRL+F) por “$” e fazer a troca por nada, com a opção “Expressões regulares” ligada. Pois o “$” é uma destas tais expressões regulares que significam o final de parágrafo.

Mas não se pode trocar diretamente todos os fins de parágrafo falsos por nada. Caso contrário, perderíamos as marcações de fins-de-parágrafo verdadeiras. Para trocar todos os fins-de-parágrafo falsos por verdadeiros, então se faz o seguinte:

  1. Se troca temporariamente todos os fins-de-parágrafo duplos por algo como ####PARAGRAFO####.
  2. Apaga-se todos os fins-de-parágrafo (troca-se por nada). isto irá juntas todos os parágrafos num único imenso paragrafão.
  3. Troca-se todos os ####PARAGRAFO#### por fim-de-parágrafo (“\n”). Isso irá inserir uma quebra de parágrafo onde realmente existia, no texto original.


Deixe uma resposta

XHTML: Você pode usar estas tags: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>

Notifique-me sem que eu precise comentar