[Obsoleto. A atualização está em no artigo Como gerei mapas dos 5570 municípios brasileiros no Google Earth]
Existem ilustrações vetoriais de limites geográficos político-administrativos e mapas de todos os 5566 municípios brasileiros na Wikipedia [em 2017, já são 5570], graças ao trabalho de um usuário que converteu ilustrações do IBGE em formato CorelDraw (CDR) para Scalable Vector Graphics (SVG).
Mas eu queria também arquivos vetoriais no formato KML do Google Earth (GE), para evitar ter que gerar e posicionar manualmente overlays de imagens PNG convertidos dos SVG, que ficam com resolução ruim vistos de perto. Pesquisando no site do IBGE, descobri arquivos de “malha digital” em formato ESRI shapefile, que é um padrão de facto de dados geográficos. Cavando mais na internet, descobri programas para converter dados geográficos com suporte para formato KML do GE. Então, gerei um KML com os limites geográficos de 5566 (já são 5570, mas não há ainda o mapa dos novos) municípios brasileiros com dados de 2007 do IBGE. O arquivo ficou com 10.8 MB, mas, apesar de grande, carrega relativamente rápido no Google Earth.
[Atualização: O Google Earth Professional, agora distribuído gratuitamente, abre diretamente shapefiles. É para Windows, mas roda bem no GNU/Linux sobre a camada de compatibilidade Wine. Ele importa os SHP, mas o nome dos municípios não fica no lugar certo do arquivo. Ainda é necessário colocar o nome pela procura-e-troca no Notepad++, conforme descrito abaixo].
Para obter o KML de um único município, procurei-o pela caixa de procura dos “Lugares” do GE, copiei e colei na própria janela de placemarks do Google Earth. Com a receita abaixo e com outros conjuntos de dados do IBGE, é possível se gerar o KML por região, por estado, por mesorregião e por microrregião. Os dados de 2005 têm melhor resolução, de 50 metros. Os outros, resolução de 250 metros. As linhas são simplificadas, pois os arquivos ficariam gigantescos se a resolução fosse maior.
Making of
Arquivo original em formato ESRI shapefile convertido para KML pelo Linux, pacote gdal-bin, programa ogr2ogr. Linha de comando:
export OGR_FORCE_ASCII=NO
ogr2ogr -f "KML" -t_srs EPSG:4326 municipios.kml 55mu2500gsr.shp
Para os dados de 2005, o comando é este:
ogr2ogr -f "KML" -s_srs EPSG:4326 -t_srs EPSG:4326 brasil.kml 55mu500gc.sh
Os placemarks são gerados sem nome pelo ogr2ogr.
Colocando nomes nos placemarks
Para colocar os nomes, usei a procura e troca do Notepad++ através de expressões regulares (regexp). Usei o recurso de regexp em que a gente agrupa um padrão de busca entre parêntesis e recoloca este padrão no texto substituído, com \1, \2
etc. Assim, peguei cada nome dentro do campo <SimpleData name="NOME">Aceguá</SimpleData>
e inseri o campo <name>Aceguá</name>
dentro de cada placemark.
Para os dados de 2005 e 2007, procurei por:
<Placemark>(\n.*?\n.*?\n.*?\n.*?.*?NOME">)(.*)</SimpleData>
Os dados de 2010 precisam desta regexp:
<Placemark>(\n.*?\n.*?\n.*?\n.*?\n.*?\n.*?.*?MUNIC">)(.*)</SimpleData>
E os dados de 2013 precisam desta regexp:
<Placemark>(.*\n?.*\n?.*?\n.*\n?.*\n?.*MUNICIP">)
(.*)</SimpleData>
Troquei por:
<Placemark>\n\t<name>\2</name>\1\2</SimpleData>
Repare que o comando \2
é uma espécie de variável que insere o nome do município guardado pelo segundo grupo de parêntesis (.*)
. O comando \1
simplesmente repete o padrão encontrado no primeiro grupo de parêntesis, o comando \2
, repete o segundo grupo de “(…)”, etc.
Mas o arquivo gerado pelo ogr2ogr tem acentuação em formato ANSI ou ISO-8859-1 (por isso a configuração OGR_FORCE_ASCII=NO
, para conservar a codificação dos acentos). No Notepad++, precisei converter para ANSI e — sem salvar o arquivo — recarregá-lo e convertê-lo para UTF-8, que é a codificação do KML (padrão XML). É um comportamento estranho, converter e recarregar sem salvar, talvez porque o Notepad++ esteja rodando em Wine. Tenho que testar a conversão no Windows.
Download
Aqui está o KMZ com todos os perímetros municipais brasileiros em 2007 em resolução de 250 metros. Arquivo com 10.8 MB. Também tem os perímetros municipais brasileiros em 2005, com melhor resolução, de 50 metros. Arquivo com 15 MB.
Preparando uma tabela Google Fusion
Para preparar uma tabela para o Google Fusion, preciso apenas do nome da cidade e do polígono relacionado a ela, separados por tabulação, num arquivo tipo TSV (valores separados por tabulação).
A expressão regular para os dados de 2013, então, é:
<Placemark>(.*\n?.*\n?.*\n?.*?\n.*\n?.*\n?.*?MUNICIP">)(.*)</SimpleData>.*?\n.*?\n
Que substituo por \2\t (o que foi encontrado mais uma tabulação). Depois limpo as marcações que sobraram, como:
\n.*?</Placemark>
E, à mão, limpo o início e fim do arquivo KML.
[2023-04-25 Nota do editor] Atualização deste post:
Referências
- Fun with shapefile. <http://levien.zonnetjes.net/?
q=shapefiles> - GDAL configuration options. <http://trac.osgeo.org/gdal/
wiki/ConfigOptions> - How to use regular expressions in Notepad++ (tutorial). <http://sourceforge.net/apps/mediawiki/notepad-plus/index.php?title=Regular_Expressions>
- KML Documentation. <https://developers.google.com/kml/documentation/>
- Shapescape. Site para converter diretamente shapefiles para tabelas do Google fusion tables. <http://www.shpescape.com/> [ 2023-04-27 nota do editor]Obsoleto. Google Fusion Tables foi descontinuado.
Parabéns pelo bom trabalho !
Valeu o prestígio, Thomas!
Prezado José Antônio
Fantástica a democratização da informação. Parabéns.
Valeu o prestígio, Martin!
Devemos agradecer ao IBGE.
Parabens, José Antonio Rocha, é um trabalho de gigante, técnica e infinita paciência! Só quem lida na área faz idéia do esforço, pesquisa e determinação demandado por essa sua realização! Informação existe até de mais, porém esparsa e descoordenada. Seu trabalho põe um fecho de ouro nesta faceta da estrutura territorial brasileira. Estou em vias de concluir estudo sobre esse assunto em que eu procuro reunir num arquivo cid+vil+pov (cidvilpovk.xls) dados como NOME do ente geográfico, Códigos UF,MESO,MICRO,MUNICÍPIO E DISTRITO, ÁREA (nos últimos censos), POPULAÇÃO (nos últimos censos), LEIS DE CRIAÇÃO, DATAS DE INSTALAÇÃO, PROVENIÊNCIAS, LIMÍTROFES, e, mais importante e inexistente, as siglas das cartas que contêm o ponto: CÓDIGO/CIM WAC 500K 250K 100K 50K, informações que, ainda que em andamento, podem ser muito úteis na parte já feita e que ponho à disposição do amigo. Mais uma vez parabéns pelo excelente trabalho. Alguém já disse que “viajar nos ombros de gigantes permite-nos enxergar mais longe”. Calorosas saudações.FRC
Obrigado, Fernando!
O trabalho duro foi feito pelo gigante IBGE. Eu só converti os dados deles.
Desejo sucesso em seu trabalho de consolidação de dados. Mande o link quando estiver pronto.
Abraços!
Prezado companheiro, seu trabalho ficou incrivel. Mas gostaria de informar que a sobreposição dos limites municipais em alguns casos acaba ficando um pouco fora da realidade no Google Earth, principalmente am locais onde a divisa é um rio, corrégo ou riacho. Pergunto se essa distorção é proposital por parte da Google?
Olá, Cláudio!
Acho que as distorções são resultado de arredondamentos tanto do IBGE quanto do Google Earth.
Parabéns pela iniciativa! Ajudou muito. Obrigado mesmo 😉
Obrigado pelo prestígio, Marcelo!