Data Journalism: torres de celular gaúchas

Mapa das torres de celular no Rio Grande do Sul feito no Google Fusion Tables com técnicas de Data Journalism.

Acessei o site de mapas “Estação Radiobase”da Anatel, conforme dica da lista Transparência Hacker:

http://sistemas.anatel.gov.br/stel/consultas/ListaEstacoesLocalidade/tela.asp?pNumServico=010

Escolhi RS e cliquei em Exportar Excel. O sistema da Anatel está bugado (Que surpresa! A Anatel não funciona direito!). Retorna um arquivo chamado “tela.asp”. ASP é coisa da Microsoft! Só podia!

Baixei o arquivo estranho, abri com o Notepad++ (rodando em Wine no meu Ubuntu) e vi que era um HTML, mas sem o cabeçalho.

Consegui reformatar os dados assim:

  1. Editei e coloquei <html><head> no início. Mudei a extensão para .html e abri no navegador (Por isto jornalista deve saber HTML). Os dados das torres de telefonia celular estão em uma tabela HTML.
  2. Copiei a página HTML inteira e colei no Notepad++ (rodando em Wine). Dessa maneira, os dados são colados como texto separado por tabulações. Um bom formato, para começar.
  3. Copiei todo o texto do Notepad++ e colei no LibreOffice Calc. Este meio-campo pelo Notepad++ elimina células mescladas que surgem quando eu colo diretamente no LibreOffice.
  4. Inseri uma coluna “A” onde colei o nome das operadoras (em linguagem de banco de dados, criei um campo “Operadora”).
  5. Apaguei os dados das operadoras no início de cada bloco de estações.
  6. Para deixar as coordenadas de latitude e longitude no formato aceito pelo Google Fusion Tables, criei colunas auxiliares ao lado das colunas de latitude e longitude com a fórmula para converter as medidas de graus-minutos-segundos-décimos para graus-décimos:
    Para latitude: =CONCATENAR(SE(EXT.TEXTO(H2;3;1)=”S“;”-”;”");EXT.TEXTO(H2;1;2)+(EXT.TEXTO(H2;4;2)+CONCATENAR(EXT.TEXTO(H2;6;2);”,”;EXT.TEXTO(H2;8;2))/60)/60)
    Para longitude: =CONCATENAR(SE(EXT.TEXTO(J2;3;1)=”W“;”-”;”");EXT.TEXTO(J2;1;2)+(EXT.TEXTO(J2;4;2)+CONCATENAR(EXT.TEXTO(J2;6;2);”,”;EXT.TEXTO(J2;8;2))/60)/60)
    Substitua H2 e J2 pela coluna onde estiverem, respectivamente, a latitude e longitude no formato “Anatel”.
    (Por isto jornalista deve saber mexer com planilhas) — ATENÇÃO: se você copiar com CTRL+C a fórmula acima, substitua as aspas tipográficas que o WordPress insere pelas aspas de computador.
  7. Copiei a tabela e colei no Notepad++ para obter as coordenadas em números. Acho que o Google Fusion não faz os cálculos das fórmulas acima.
  8. Ainda para deixar os dados de acordo com o Fusion, substituí a vírgula decimal pelo ponto decimal com a expressão regular “([0-9][0-9]),” e “(\t[0-9]),” substituída por “\1.”  (não consegui usar ponto decimal no Calc. O padrão brasileiro é vírgula decimal).
    (por isto jornalista deve saber linguagens de computador. Neste caso, a linguagem chama-se Expressões Regulares. É uma maneira de filtrar texto.)
  9. Gravei em formato de Valores Separados por Vírgula — CSV (Por isto jornalista deve conhecer formatos de arquivo) e mandei para o Google Fusion (“Criar > Mais > Tabela (beta)” no Google Disc), indicando TAB como separador e eliminando as colunas de coordenadas inválidas fornecidas pela Anatel.
  10. Depois de uploudar para o Fusion, editei as colunas de latitude e longitude, definindo-as como tipo “Location”, e passei a visualização para Map.

Agora, posso embutir o mapa em páginas jornalísticas.

Sobre José Antonio Rocha

Jornalista, professor de Planejamento Gráfico e Mídias Digitais da Universidade Federal de Santa Maria, campus da cidade de Frederico Westphalen, Rio Grande do Sul, Brasil.