Acessar um banco de dados MySQL com a linguagem script do Scribus (Python) é moleza. Mas a maioria dos gerenciadores de conteúdo, como o WordPress, usam formatação HTML em seu conteúdos ou posts. Para construir meu sistema editorial com Scribus, Python, MySQL e WordPress eu precisaria de um conversor de HTML para o formato de texto interno do Scribus. Acho que isso até é possível, mas prefiro seguir uma gambiarra mais simples e segura:
- Ler o conteúdo dos artigos do banco de dados
- Gravar como arquivo HTML (adicionando um cabeçalho e um rodapé HTML)
- Importar para o Scribus aproveitando essas características:
Notes on Importing HTML into Scribus
Scribus has an HTML importer which can import clean, well formed HTML and retain much of the layout and and formatting, provided the formatting or styling is basic HTML in the HTML markup, not via css style sheets. CSS support will come in the future. (Scribus:. GPL Desktop Publishing and More)
Na página explica também a formatação HTML simples que o Scribus importa:
- body, div, a. Corpo do documento, divisão, âncora de hipertexto.
- p e br. Parágrafo e quebra de linha.
- H1 até H4. Títulos até tamanho 4.
- ol,ul,li. Listas de bolinhas e lista numerada
- pre e code – Texto préformatado e códigos de programação. Serão formatados com fonte Courier.
- Links web serão convertidos para texto azul.
- b, u, i, em, strong,sub.sup,del. Negrito, sublinhado, itálico (grifo), enfatizado, pesado, subscrito — como em H2O, superescrito — como em m3, riscado. Os efeitos dependem da fonte usada.
Esta formatação é mais que suficiente para um jornalista produzir seu material.
Ao ser importado, o texto fica com os estilos: HTML_h1, HTML_p, etc. Portanto, a programação gráfica do jornal no Scribus já deve ser feita a partir destes nomes. Eles devem estar na folha de estilos default da publicação.
A gravação em HTML das matérias a diagramar é um fator de segurança a mais no sistema. Se houver problemas com o banco de dados, a matérias em diagramação estão salvas no sistema de arquivos em um formato texto-plano, comum e simples, que qualquer editor de texto pode abrir.
O problema de interpretação pelo Scribus de conteúdo formatado de Gerenciadores de Conteúdo (CMS) está resolvido. Os arquivos podem ficar em uma entrutura hierárquica repoduzindo as páginas do jornal. As imagens e figuras podem ficar nas mesmas pastas, para facilitar a manipulação.
Acho que um único detalhe chato é que não achei comando em Python para importar um texto no Scribus através de script. Acho que ainda não foi escrito. Soluções possíveis:
- Abrir uma janela de diálogo de abrir arquivo, com o filtro já definido para o arquivo que deve ser aberto. O diagramador só precisará dar OK para importar o arquivo. Vantagem: o filtro HTML do Scribus funciona. Desvantagem: é manual, exige a ação do diagramador.
- Abrir um arquivo com o comando padrão Python para ler arquivo:
file = open('p05m01.html', 'r')
Mas, neste caso, não é possível a aplicação do filtro. Não vale a pena fazer porque é o mesmo que buscar o contúdo no banco de dados. O texto vem com tags HTML simples. Vantagem: pode ser automatizada. Um único script pode montar uma página inteira. Desvantagem: terei de encontrar uma maneira de formatar o texto conforme o formato interno do Scribus.
Hum… a primeira vez que o Scribus roda, ele demora muito para avaliar todas as fontes. Não chega a travar, mas demora bastante. Depois, entra rapidinho. Outro motivo podem ser as fontes. Ontem descobri que o GIMP demora muito para escanear as fontes orientais (chinês, Japonês, coreano), que são enormes.
A idéia no caso seria usar as tags com atributos class ou id tanto para formatação com CSS na web como para marcar campos para buscas mais precisas. No Scribus se por enquanto ele simplesmente ignorar os atributos e tratar todas como a mesma tag p já ajuda muito. Se for possível usá-las como estilos específicos ou variações, melhor ainda. De qualquer forma, já é muito boa a intenção deles de trabalhar com CSS em breve.
Não sei o que acontece com o Scribus no Windows. Instalei a última versão, instalei o GhostScript recomendado e não tem jeito mesmo. Até troquei os temas (recomendam usar o “classic”), mas pode ser também problema com as fontes, já que ressaltam a “intolerância” do programa e ele trava justamente quando começa a scannear elas.
Tenho uma partição com Ubuntu e devo testar por enquanto lá.
Um abraço,
Olá, César!
Testei pouco, mas o atributo de tag CENTER funciona. É questão de se testar outros parâmetros. Acredito que, com o tempo, este programa ficará com suporte HTML cada vez melhor.
BTW, quais dificuldades você teve em rodar o Scribus para Windows? Usei o instalador da versão 1.3.3 e 1.3.4 e tudo correu bem.
Abração!
O formulário converteu as tags, mas a intenção era usar como exemplo algo como
p class = “resumo” ou p class = “abstract”.
Caro José Antonio,
Já consultei o seu site em outras ocasiões e hoje chego a ele de novo através de um resultado google (scribus html import).
Muito bom o material que disponibilizou. Estava mesmo trabalhando em algo similar para uma revista acadêmica. Inicialmente pensava em trabalhar com WordPress + InDesign, mas além de se tratar de um programa pago (e caro) mesmo o XML exportado pelo WordPress precisaria de toda uma rotina de adaptações para corresponder a formatação básica.
Só não testei ainda o Scribus porque não consegui fazê-lo rodar no Windows (mais um motivo para migrar pro Ubuntu Studio…)
A minha dúvida: é possível trabalhar com atributos (class, id) nas tags suportadas? Algo como … ou ….
Desde já agradeço a atenção.