{"id":132,"date":"2007-06-18T19:00:14","date_gmt":"2007-06-18T22:00:14","guid":{"rendered":"http:\/\/www.meiradarocha.jor.br\/news\/2007\/06\/18\/perfis-de-dados-fraudados\/"},"modified":"2010-10-13T23:42:37","modified_gmt":"2010-10-14T02:42:37","slug":"perfis-de-dados-fraudados","status":"publish","type":"post","link":"https:\/\/meiradarocha.jor.br\/news\/2007\/06\/18\/perfis-de-dados-fraudados\/","title":{"rendered":"Perfis de dados fraudados"},"content":{"rendered":"<p>No <a href=\"http:\/\/meiradarocha.jor.br\/news\/2007\/06\/17\/a-lei-newcombbenford-para-descobrir-fraudes\/\">artigo sobre a lei de Benford<\/a>, expliquei como funciona uma caracter\u00edstica num\u00e9rica da natureza. Aqui, mostro alguns perfis num\u00e9ricos que podem denunciar fraudes em grandes quantidades de n\u00fameros. Fiz alguns perfis obtidos com tabelas e geradores de n\u00fameros aleat\u00f3rios. Nos gr\u00e1ficos desta p\u00e1gina, as linhas verdes representam os n\u00fameros de Benford; os vermelhos, n\u00fameros encontrados nos servi\u00e7os de busca Google e Yahoo; e em azul, n\u00fameros encontrados na mem\u00f3ria <em>clipboard <\/em>do computador, copiados com <kbd>CTRL<\/kbd>+<kbd>C<\/kbd>.<!--more--><\/p>\n<p>Eu adicionei o zero na seq\u00fc\u00eancia de Benford para poder comparar com os dados encontrados nos servi\u00e7os de busca e na mem\u00f3ria. Mas a seq\u00fc\u00eancia real n\u00e3o tem zero porque n\u00e3o \u00e9 poss\u00edvel se calcular o logaritmo de zero (zero vezes zero \u00e9 zero). Para o c\u00e1lculo dos zeros, coloquei um n\u00famero menor que o do d\u00edgito 9.<\/p>\n<p>Dez mil n\u00fameros pseudo-aleat\u00f3rios (tamb\u00e9m chamados rand\u00f4micos) de at\u00e9 nove d\u00edgitos:<\/p>\n<p><a title=\"serie-randomica-at-10-mil\" href=\"http:\/\/www.meiradarocha.jor.br\/news\/wp-content\/uploads\/2007\/06\/serie-randomica-at-10-mil.png\"><img decoding=\"async\" src=\"http:\/\/www.meiradarocha.jor.br\/news\/wp-content\/uploads\/2007\/06\/serie-randomica-at-10-mil.png\" alt=\"serie-randomica-at-10-mil\" \/><\/a><\/p>\n<p>Todos os algarismos t\u00eam uma ocorr\u00eancia pr\u00f3xima daquela do quatro. Mas repare como o zero aparece menos que os outros algarismos, porque n\u00e3o \u00e9 colocado antes do um, em geral.<\/p>\n<p>Outra imagem interessante mostra que os d\u00edgitos dos servi\u00e7os de busca parecem ser uma m\u00e9dia em rela\u00e7\u00e3o \u00e0 Lei de Benford. Isto me leva a especular que o grupo de n\u00fameros nos bancos de dados dos servi\u00e7os de busca s\u00e3o uma mistura de:<\/p>\n<ol>\n<li>N\u00fameros aleat\u00f3rios e gerados por humanos, que tendem a se aproximar do perfil reto;<\/li>\n<li>N\u00fameros gerados pela natureza, que tendem a seguir o perfil logar\u00edtmico de Benford.<\/li>\n<\/ol>\n<p>O c\u00f3digo para gerar a s\u00e9rie pseudo-aleat\u00f3ria foi digitado diretamente na linha de comando Rebol:<\/p>\n<pre>nums: copy \"\"\r\nwrite\/lines clipboard:\/\/ clip: for contador 0 10000 1 [\r\nnums: rejoin [ nums \" \" random 100'000'000 ]\r\n]<\/pre>\n<p>O programa em linguagem Rebol acima gerou uma seq\u00fc\u00eancia como mostrada abaixo (mas os n\u00fameros variam, sempre), colocada na vari\u00e1vel clip que foi copiada para o clipboard:<\/p>\n<pre>clip\r\n== { 68935550 44854059 11730766 9702419 97855313 7687301 95670787\r\n13863691 83617277 18419172 1892882 91543935 55541291 40617909 323...<\/pre>\n<p>Com rela\u00e7\u00e3o aos dados do perfil dos servi\u00e7os de busca, no gr\u00e1fico acima, noto tamb\u00e9m uma quantidade de oitos ligeiramente maior do que se esperaria. Isto parece se manter durante leituras em v\u00e1rias oportunidades diferentes, nos servi\u00e7os de busca, com browsers diferentes. Para mim, \u00e9 um mist\u00e9rio porque havia mais oitos. Talvez muitas ocorr\u00eancias do ano de 1998.<\/p>\n<h3>Seq\u00fc\u00eancias de n\u00fameros<\/h3>\n<p>Uma seq\u00fc\u00eancia de inteiros de 1 a 9999 gerou este perfil:<\/p>\n<p><a title=\"sequencia-de-um-a-dez-mil.\" href=\"http:\/\/www.meiradarocha.jor.br\/news\/wp-content\/uploads\/2007\/06\/sequencia-de-um-a-dez-mil.png\"><img decoding=\"async\" src=\"http:\/\/www.meiradarocha.jor.br\/news\/wp-content\/uploads\/2007\/06\/sequencia-de-um-a-dez-mil.png\" alt=\"sequencia-de-um-a-dez-mil.\" \/><\/a><\/p>\n<p>Compreensivamente, este perfil \u00e9 extremamente sim\u00e9trico, com exce\u00e7\u00e3o do 0, que n\u00e3o aparece \u00e0 direita dos algarismos e por isso tem menor freq\u00fc\u00eancia. Com isto, os outros algarismos aparecem ligeiramente mais que dez por cento.<\/p>\n<p>Tamb\u00e9m se nota que os zeros aparecem menos que nos servi\u00e7os de busca, mas igual aos zeros pseudo-Benford.<\/p>\n<p>Para gerar a s\u00e9rie com n\u00fameros de 1 a dez mil, usei o seguinte programa Rebol diretamente na linha de comando. O programa criou uma s\u00e9rie e copiou para a mem\u00f3ria:<\/p>\n<pre>nums: copy \"\"\r\nwrite\/lines clipboard:\/\/ clip: for contador 0 10000 1 [\r\nnums: rejoin [ nums \" \" contador ]\r\n]<\/pre>\n","protected":false},"excerpt":{"rendered":"<p>No artigo sobre a lei de Benford, expliquei como funciona uma caracter\u00edstica num\u00e9rica da natureza. Aqui, mostro alguns perfis num\u00e9ricos que podem denunciar fraudes em grandes quantidades de n\u00fameros. Fiz [&hellip;]<\/p>\n","protected":false},"author":2,"featured_media":0,"comment_status":"open","ping_status":"open","sticky":false,"template":"","format":"standard","meta":{"footnotes":""},"categories":[32,10,7],"tags":[],"class_list":["post-132","post","type-post","status-publish","format-standard","hentry","category-investigacao","category-jornalismo","category-jornalismo-online"],"_links":{"self":[{"href":"https:\/\/meiradarocha.jor.br\/news\/wp-json\/wp\/v2\/posts\/132","targetHints":{"allow":["GET"]}}],"collection":[{"href":"https:\/\/meiradarocha.jor.br\/news\/wp-json\/wp\/v2\/posts"}],"about":[{"href":"https:\/\/meiradarocha.jor.br\/news\/wp-json\/wp\/v2\/types\/post"}],"author":[{"embeddable":true,"href":"https:\/\/meiradarocha.jor.br\/news\/wp-json\/wp\/v2\/users\/2"}],"replies":[{"embeddable":true,"href":"https:\/\/meiradarocha.jor.br\/news\/wp-json\/wp\/v2\/comments?post=132"}],"version-history":[{"count":0,"href":"https:\/\/meiradarocha.jor.br\/news\/wp-json\/wp\/v2\/posts\/132\/revisions"}],"wp:attachment":[{"href":"https:\/\/meiradarocha.jor.br\/news\/wp-json\/wp\/v2\/media?parent=132"}],"wp:term":[{"taxonomy":"category","embeddable":true,"href":"https:\/\/meiradarocha.jor.br\/news\/wp-json\/wp\/v2\/categories?post=132"},{"taxonomy":"post_tag","embeddable":true,"href":"https:\/\/meiradarocha.jor.br\/news\/wp-json\/wp\/v2\/tags?post=132"}],"curies":[{"name":"wp","href":"https:\/\/api.w.org\/{rel}","templated":true}]}}