{"id":131,"date":"2007-06-17T18:54:11","date_gmt":"2007-06-17T21:54:11","guid":{"rendered":"http:\/\/www.meiradarocha.jor.br\/news\/2007\/06\/17\/a-lei-newcombbenford-para-descobrir-fraudes\/"},"modified":"2017-09-15T12:54:48","modified_gmt":"2017-09-15T15:54:48","slug":"a-lei-newcombbenford-para-descobrir-fraudes","status":"publish","type":"post","link":"https:\/\/meiradarocha.jor.br\/news\/2007\/06\/17\/a-lei-newcombbenford-para-descobrir-fraudes\/","title":{"rendered":"A lei Newcomb\/Benford para descobrir fraudes"},"content":{"rendered":"<p>Coisas que podem ser enumeradas, na natureza, apresentam uma propriedade matem\u00e1tica interessante. Ningu\u00e9m sabe explicar porqu\u00ea, mas se voc\u00ea fizer uma lista muito grande com contagem de coisas &#8212; qualquer coisa &#8212; , a ocorr\u00eancia do primeiro d\u00edgito nos n\u00fameros desta lista apresentar\u00e1 o seguinte perfil:<!--more--><\/p>\n<table style=\"margin: 0pt 0pt 12px;\" border=\"1\">\n<tbody>\n<tr>\n<th>D\u00edgito<\/th>\n<th>1<\/th>\n<th>2<\/th>\n<th>3<\/th>\n<th>4<\/th>\n<th>5<\/th>\n<th>6<\/th>\n<th>7<\/th>\n<th>8<\/th>\n<th>9<\/th>\n<\/tr>\n<tr>\n<th>Ocorr\u00eancia como primeiro d\u00edgito(%)<\/th>\n<td>30,1<\/td>\n<td>17,6<\/td>\n<td>12,5<\/td>\n<td>9,7<\/td>\n<td>7,9<\/td>\n<td>6,7<\/td>\n<td>5,8<\/td>\n<td>5,1<\/td>\n<td>4,6<\/td>\n<\/tr>\n<\/tbody>\n<\/table>\n<p>Ou seja: o d\u00edgito &#8220;1&#8221; aparecer\u00e1 em 30,1% da vezes; O d\u00edgito &#8220;2&#8221;, em 17,6%, e assim por diante. Esta caracter\u00edstica foi observada pela primeira vez pelo astr\u00f4nomo norte-americano <strong>Simon Newcomb<\/strong> em 1881, ao notar que a t\u00e1bua de logaritmos tem mais p\u00e1ginas com logaritmos come\u00e7ando com 1 do que come\u00e7ando com outros d\u00edgitos. Sua descoberta foi ignorada at\u00e9 1938, quando o Dr. <strong>Frank Benford<\/strong>, f\u00edsico da General Electric, redescobriu o fato e fez uma an\u00e1lise muito mais ampla que Newcomb. Ele observou mais de 20 mil fontes de dados, desde \u00e1rea de rios e estat\u00edsticas de <em>baseball<\/em> at\u00e9 os n\u00fameros das casas de pessoas.<\/p>\n<p>O Dr. Benford ent\u00e3o formulou:<\/p>\n<blockquote><p><em>Se a certeza absoluta \u00e9 definida como 1 e a absoluta impossibilidade como 0, ent\u00e3o a probabilidade de um n\u00famero &#8220;d&#8221; de 1 a 9 ser o primeiro d\u00edgito \u00e9 o logaritmo de base 10 de (1 + 1\/d).<\/em><\/p><\/blockquote>\n<p>Para quem n\u00e3o gosta de matem\u00e1tica, a f\u00f3rmula simplesmente define as porcentagens da tabela acima. Ou seja: o n\u00famero 1 tem 30,1% de chances de ser o primeiro d\u00edgito de um determinado valor, o d\u00edgito 2, 17,6% de chances, etc. <strong>Isto acontece independentemente da escala ou do tipo de medida<\/strong> (jarda, metros, litros, polegadas).<\/p>\n<p>O que poderia ser uma mera curiosidade matem\u00e1tica encontra aplica\u00e7\u00f5es muito \u00fateis para o <strong>jornalista investigativo<\/strong>. A chamada Lei de Benford pode ser usada para descoberta de fraudes em grandes quantidades num\u00e9ricas, como balan\u00e7os e estat\u00edsticas.<\/p>\n<p>Foi assim que o blog Superf\u00edcie Reflexiva descobriu anomalias em umas das pesquisas da Microsoft que mostra as vantagens do Windows sobre o Linux. Havia um desvio muito grande no algarismo &#8220;6&#8221;.<\/p>\n<h3>Contagem facilitada<\/h3>\n<p>Para facilitar o trabalho do jornalista investigativo, desenvolvi um programa que conta a ocorr\u00eancia de d\u00edgitos na mem\u00f3ria (na clipboard dos computadores). Ele funciona assim: voc\u00ea copia dados para a mem\u00f3ria, roda o programa, clica em &#8220;Calcula&#8221; e ele apresenta um gr\u00e1fico de ocorr\u00eancia de d\u00edgitos, a partir dos dados na mem\u00f3ria.<\/p>\n<p>Al\u00e9m da contagem de caracteres na mem\u00f3ria, o programa ainda faz uma compara\u00e7\u00e3o com a m\u00e9dia da quantidade de d\u00edgitos encontrada no Google e no Yahoo. Na verdade, eu fiz uma simplifica\u00e7\u00e3o da lei Newcomb\/Benfort, porque peguei uma amostragem gigantesca de d\u00edgitos usados pela humanidade, dispon\u00edvel nos bancos de dados dos servi\u00e7os de busca.<\/p>\n<p>Considerei que n\u00e3o importaria se eu contasse apenas o primeiro d\u00edgito de valores num\u00e9ricos ou todos os d\u00edgitos. Minha hip\u00f3tese \u00e9 a de que os d\u00edgitos restantes tamb\u00e9m obedecem a um perfil determinado, n\u00e3o exatamente conforme a escala logaritmica de Benford.<\/p>\n<p>De fato, a qualquer momento que voc\u00ea fizer a procura por d\u00edgitos no Google ou Yahoo, voc\u00ea vai obter aproximadamente o mesmo perfil. Se uma grande amostragem aleat\u00f3ria tem este perfil, uma pequena amostragem deve ter caracter\u00edsticas aproximadas.<\/p>\n<p>Uma diferen\u00e7a not\u00e1vel em rela\u00e7\u00e3o ao trabalho de Benford \u00e9 que fa\u00e7o a contagem do zero, tamb\u00e9m. Como n\u00e3o existe logaritmo de zero, Belford n\u00e3o o usou, mas uma &#8220;gugada&#8221; revela que a ocorr\u00eancia de zeros \u00e9 menor que a ocorr\u00eancia de algarismos 9. Como zeros podem revelar arredondamentos num\u00e9ricos, \u00e9 importante considerar este algarismo, tamb\u00e9m. Usei um valor que gerou uma curva mais suave no perfil de d\u00edgitos.<\/p>\n<p>O resultado \u00e9 este, sem n\u00fameros na mem\u00f3ria:<\/p>\n<p><a title=\"Gr\u00e1fico de contagem de d\u00edgitos\" href=\"http:\/\/www.meiradarocha.jor.br\/news\/wp-content\/uploads\/2007\/06\/digitos-2006-9-16-5485.png\"><img decoding=\"async\" src=\"http:\/\/www.meiradarocha.jor.br\/news\/wp-content\/uploads\/2007\/06\/digitos-2006-9-16-5485.png\" alt=\"Gr\u00e1fico de contagem de d\u00edgitos\" \/><\/a><\/p>\n<p>O sistema dos servi\u00e7os de busca arredonda os resultados. Por exemplo, em abril de 2004 o Google cadastrava 897.000.000 ocorr\u00eancias do algarismo &#8220;5&#8221;. Ignorando as casas do milh\u00e3o, temos 897. Somando as ocorr\u00eancias arredondadas de todos os d\u00edgitos, temos uma escala de quase 10 mil unidades. Ou seja, a escala tem resolu\u00e7\u00e3o de 0,001%, o que considero razo\u00e1vel para os prop\u00f3sitos de se fazer uma escala comparativa.<\/p>\n<h3>O programa<\/h3>\n<p>Para codificar o programa contador de caracteres, usei a linguagem Rebol (<a href=\"http:\/\/www.rebol.com\/\">http:\/\/www.rebol.com<\/a>), gratuita e semi-open source, desenvolvida especialmente para internet. \u00c9 f\u00e1cil de programar e d\u00e1 um banho em aberra\u00e7\u00f5es como linguagem Java.<\/p>\n<ul>\n<li>Baixe e instale o <a href=\"http:\/\/www.rebol.com\/view-platforms.html\">interpretador Rebol\/view<\/a> para sua plataforma.<\/li>\n<li>Relacione a extens\u00e3o *.r ao interpretador Rebol.<\/li>\n<li>Baixe e grave o script Rebol <a href=\"http:\/\/meiradarocha.jor.br\/news\/wp-content\/uploads\/2008\/07\/frequencia-de-digitos-2008-07-31a.r\">frequencia-de-digitos-2008-07-31a<\/a>.<\/li>\n<li>Execute o programa baixado.<\/li>\n<\/ul>\n<p>O script \u00e9 multiplataforma, rodando em Linux, Solaris, BSD, Windows e Macintosh. Para us\u00e1-lo, copie os dados de uma planilha eletr\u00f4nica, por exemplo, e rode o programa. Depois de alguns segundos, ser\u00e1 apresentado o gr\u00e1fico de ocorr\u00eancias de d\u00edgitos e a compara\u00e7\u00e3o com o perfil de d\u00edgitos do Google.<\/p>\n<h3>Limita\u00e7\u00f5es<\/h3>\n<p>Este \u00e9 um m\u00e9todo interessante mas nem sempre \u00e9 \u00fatil para an\u00e1lise de dados. Existem algumas caracter\u00edstica que limitam o uso da Lei de Benford:<\/p>\n<ul>\n<li>O perfil de ocorr\u00eancia de d\u00edgitos n\u00e3o funciona para dados como n\u00fameros gerados aleatoriamente (n\u00fameros de loteria), pois eles n\u00e3o s\u00e3o contagens de fen\u00f4menos naturais. S\u00f3 casualmente s\u00e3o n\u00fameros, pois poderiam ser cores ou bichos (Grande id\u00e9ia! Vou patentear uma loteria zool\u00f3gica!). Uma listagem de n\u00fameros aleat\u00f3rios tende a ter a mesma quantidade de algarismos, apresentando um perfil reto.<\/li>\n<li>O perfil com n\u00fameros inventados por humanos tende a ser pr\u00f3ximo do aleat\u00f3rio. Isto n\u00e3o \u00e9 desvantagem, pelo contr\u00e1rio. \u00c9 a maneira de se saber se um balan\u00e7o foi fraudado por humanos, por exemplo. N\u00e3o funciona, igualmente, com n\u00fameros arredondados (melhor: denunciar\u00e1 o arredondamento).<\/li>\n<li>O perfil n\u00e3o funciona bem com pequenas quantidades num\u00e9ricas. Quanto maior a quantidade, mais o perfil vai se apresentar como na f\u00f3rmula de Benfort.<\/li>\n<li>O perfil n\u00e3o funciona com datas. Procure deixar dadas fora da sele\u00e7\u00e3o, na hora de copiar dados para a clipboard. Datas como 1999 ou 2004 aumentam a quantidade de d\u00edgitos 9 e zero, por exemplo, desequilibrando o perfil.<\/li>\n<li>O perfil n\u00e3o funciona com varia\u00e7\u00f5es determinadas em torno de um valor. Por exemplo, valores em torno de mais ou menos 100% podem ter grande incid\u00eancia de d\u00edgitos 9, zero e um: 98%, 99%, 101%. Este tipo de tabela tende a ter um perfil parab\u00f3lico.<\/li>\n<li>O perfil poder\u00e1 ser diferente conforme determinado tipo de dados, embora os dados estejam corretos.<\/li>\n<\/ul>\n<p>Apesar destas limita\u00e7\u00f5es, usar este m\u00e9todo pode ser um bom in\u00edcio de investiga\u00e7\u00e3o.<\/p>\n<h3>Bibliografia<\/h3>\n<ol>\n<li><strong>Benford&#8217;s law<\/strong>. in. Wolfram Research. Dispon\u00edvel em:&lt;<a href=\"http:\/\/mathworld.wolfram.com\/BenfordsLaw.html\">http:\/\/mathworld.wolfram.com\/BenfordsLaw.html<\/a>&gt;. Lido em: 2004-04-10.<\/li>\n<li>BROWNE, Malcolm W. <a href=\"http:\/\/www.rexswain.com\/benford.html\"><strong>Following Benford&#8217;s Law, or Looking Out for No. 1<\/strong><\/a>. Site Web em: <a href=\"http:\/\/www.rexswain.com\/benford.html\">http:\/\/www.rexswain.com\/benford.html<\/a>. Acesso em: 2004-04-10. Republica\u00e7\u00e3o de mat\u00e9ria no The New York Times de 1998-09-04.<\/li>\n<li><a href=\"http:\/\/intuitor.com\/\">Intuitor.com.<\/a> <strong>Benford&#8217;s Law Part 1<\/strong> &#8211; How to Spot Tax Fraud. Site Web em:&lt;<a href=\"http:\/\/www.intuitor.com\/statistics\/Benford%27s%20Law.html\">http:\/\/www.intuitor.com\/statistics\/Benford&#8217;s%20Law.html<\/a>&gt;. Acesso em: 2004-04-10.<\/li>\n<li><strong>Rebol Technologies<\/strong>. Site Web dispon\u00edvel em: <a href=\"http:\/\/www.rebol.com\/\">&lt;http:\/\/www.rebol.com<\/a>&gt;. Acesso em: 2004-04-10.<\/li>\n<li><strong>Wikipedia<\/strong>. Verbete &#8220;Benford&#8217;s Law&#8221; &lt;<a href=\"http:\/\/en.wikipedia.org\/wiki\/Benford%27s_law\">http:\/\/en.wikipedia.org\/wiki\/Benford%27s_law<\/a>&gt;. Acesso em 15 set. 2006.<\/li>\n<\/ol>\n<h3>Saiba mais<\/h3>\n<ul>\n<li>OLIVEIRA JUNIOR, Francisco Alves de. <a href=\"https:\/\/franciscoalvesjunior.wordpress.com\/2010\/08\/24\/evidencias-empiricas-acerca-da-aplicacao-da-lei-de\/#comment-7\">Evid\u00eancias emp\u00edricas acerca da aplica\u00e7\u00e3o da Lei de Newcomb-Benford no campo da auditoria do Sistema Eleitoral Brasileiro.<\/a> Jo\u00e3o Pessoa: UNIP\u00ca, 2007.<br \/>\n[Excelente trabalho de conclus\u00e3o de p\u00f3s-gradua\u00e7\u00e3o que analisa os n\u00famero da elei\u00e7\u00e3o presidencial de 2005, no Brasil. Um ap\u00eandice mostra como fazer uma planilha digital com as f\u00f3rmulas todas.]<\/li>\n<\/ul>\n","protected":false},"excerpt":{"rendered":"<p>Coisas que podem ser enumeradas, na natureza, apresentam uma propriedade matem\u00e1tica interessante. Ningu\u00e9m sabe explicar porqu\u00ea, mas se voc\u00ea fizer uma lista muito grande com contagem de coisas &#8212; qualquer [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[10,7],"tags":[],"class_list":["post-131","post","type-post","status-publish","format-standard","hentry","category-jornalismo","category-jornalismo-online"],"_links":{"self":[{"href":"https:\/\/meiradarocha.jor.br\/news\/wp-json\/wp\/v2\/posts\/131","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/meiradarocha.jor.br\/news\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/meiradarocha.jor.br\/news\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/meiradarocha.jor.br\/news\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/meiradarocha.jor.br\/news\/wp-json\/wp\/v2\/comments?post=131"}],"version-history":[{"count":2,"href":"https:\/\/meiradarocha.jor.br\/news\/wp-json\/wp\/v2\/posts\/131\/revisions"}],"predecessor-version":[{"id":4241,"href":"https:\/\/meiradarocha.jor.br\/news\/wp-json\/wp\/v2\/posts\/131\/revisions\/4241"}],"wp:attachment":[{"href":"https:\/\/meiradarocha.jor.br\/news\/wp-json\/wp\/v2\/media?parent=131"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/meiradarocha.jor.br\/news\/wp-json\/wp\/v2\/categories?post=131"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/meiradarocha.jor.br\/news\/wp-json\/wp\/v2\/tags?post=131"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}