Lotofácil – Lei de Benford – Análise Combinatória Loterias

“A lei de Benford, também chamada de lei do primeiro dígito, declara que em listas de números de muitas fontes de dados da vida real, o dígito principal é 1 quase um terço do tempo, e números maiores ocorrem como o dígito principal com menos e menos frequência à medida que aumentam em magnitude, a ponto de 9 ser o primeiro dígito a menos de uma vez em vinte. 

Este resultado contra-intuitivo se aplica a uma grande variedade de números, incluindo contas de eletricidade, endereços, preços de ações, números da população, taxas de mortalidade, extensões de rios, constantes físicas e matemáticas e processos descritos por leis de energia (que são muito comuns em natureza).  

Recebeu o nome do físico Frank Benford, que o declarou em 1938, embora tivesse sido afirmado anteriormente por Simon Newcomb em 1881. A primeira formulação e prova rigorosa parece ser devida a Theodore P. Hill em 1988. ”… Wikipedia.org ( uma enciclopédia online)

 

De acordo com a Lei de Benford, os dígitos iniciais devem ser distribuídos (na base 10) de acordo com a seguinte expressão:

LOG ((D + 1) / D)

O “D” na expressão significa simplesmente um dígito específico (1-9).   Para ver como o dígito “1” deve ser distribuído, a fórmula ficaria assim: log ((1 + 1) / 1).   Isso é igual a 0,3010, que é 30,10%.   Para o dígito “2”, a fórmula seria log ((2 + 1) / 2) … isso é igual a 0,1761 ou 17,61%.

Quando usamos a fórmula para calcular as distribuições de todos os dígitos de 1 a 9, obtemos a seguinte tabela:

DígitoFrequência

Por cento

10,301030,10%
20,176117,61%
30,124912,49%
40,09699,69%
50,07927,92%
60,06696,69%
70,05805,80%
80,05125,12%
90,04584,58%

Como a tabela indica, os dígitos iniciais encontrados em uma grande amostra de dados estatísticos serão distribuídos de forma muito desigual … com muito mais números começando com o dígito um do que com o dígito nove!   Exatamente por que isso ocorre, pode ser atribuído à probabilidade de probabilidade.

A Lei de Benford é intrigante em suas muitas aplicações possíveis. 

Um de seus usos mais interessantes é o de detecção de fraudes! 

Isso é feito simplesmente medindo os valores de uma grande série de dados em relação aos resultados esperados calculados pela Lei de Benford. 

Leia os três links a seguir para obter uma melhor compreensão do que é a Lei de Benford e como ela é usada … preste atenção especial em como esses sites implicam que a Lei de Benford NÃO se aplica à loteria … Então volte e leia o resto deste publicar.    

 

http://plus.maths.org/issue9/features/benford/index.html

http://ddrive.cs.dal.ca:9999/page/lvl3/13

 

Os artigos basicamente insinuam que você não deve ficar tentado a jogar combinações que começam com o dígito 1 só porque a Lei de Benford diz que o dígito 1 deve ocorrer com muito mais frequência do que os outros dígitos … “O resultado da loteria como Lotofácil, Mega Sena é verdadeiramente aleatório, o que significa que cada número de loteria possível tem uma chance igual de ocorrer. 

As frequências dos dígitos iniciais devem, portanto, a longo prazo, estar na proporção exata do número de números da loteria começando com aquele dígito. ” … PLUS.MATHS.ORG

Se você olhar para as frequências dos dígitos com base no dígito real impresso nas bolas, então sim, eles aparecerão quase uniformemente em todo o espectro em uma proporção que é igual ao número de combinações que começam com aquele dígito. 

Este é um acéfalo para a maioria dos jogadores de loteria.   É claro que cada bola e / ou combinação aparecerá quase igualmente por um longo período de tempo! Duh!

No entanto, quando se percebe que os números nas bolas nada mais são do que simples imagens e que o tempo entre as ocorrências das imagens é mais importante do que as próprias imagens, então pode-se entender que a probabilidade de probabilidade é mais controladora para o jogo do que a própria aleatoriedade. 

Com isso em mente, a Lei de Benford se aplica a jogos de loteria e aqui está como podemos observá-la:

Primeiro, você deve desconsiderar os números reais nas bolas, pelo menos na medida em que a frequência dos números reais não é o que você está rastreando.   No Pick 3, não esperamos que o dígito 1 seja desenhado com mais freqüência do que o dígito 8. 

Também não esperamos que um combo como 137 seja desenhado mais do que o combo 589 só porque o combo 137 começa com um dígito inicial de 1.   O que realmente queremos rastrear é o tempo entre os acertos do número nas bolas ou as combinações que eles compõem! 

Em outras palavras, queremos rastrear os saltos, não os números das bolas em si … é aqui que a Lei dos Primeiros Dígitos de Benford existe na loteria! 

É realmente tudo sobre sucessos e saltos.

Ao aplicar a Lei de Benford aos saltos, primeiro temos que delinear as possibilidades dos saltos.   Isso é muito simples, pois o que estamos rastreando será o dígito inicial de uma extremidade de salto.   De acordo com a “Lei”, devemos ver cerca de 30,10% de todos os saltos terminarem com um valor de dígito inicial de 1 (se o que estou dizendo sobre a aplicação de “A Lei” aos saltos for verdade). 

Portanto, primeiro precisamos descobrir quantos saltos possíveis existem e onde todos eles terminam.

Vamos supor que o último número do Pick 3 direto sorteado foi 764. 

Quando será a próxima vez que ele poderá ser sorteado?   Pode ser empatado no próximo jogo, que é um jogo depois, ou uma repetição consecutiva.   Pode ser empatado dois jogos depois. 

Na verdade, pode muito bem esperar milhares ou até mais!   O ponto aqui é que existem certos intervalos para saltos até o fim que contêm o mesmo dígito inicial.   Devo salientar que zero é um dígito inicial impossível para um salto terminar neste ambiente. 

Se um número direto acertar e depois repetir e acertar o próximo jogo, não é contado como um salto de zero, mas ao invés disso, diz-se que acertou exatamente um jogo após seu último acerto, que é registrado como 1.

Portanto, para todos os efeitos, os pulos terminarão com os dígitos iniciais de 1 a 9.   Aqui está como os intervalos para todos os pulos são divididos na Escolha 3:

Salta terminando no dígito inicial de 1

1 jogo depois de
10 a 19
100 a 199
1.000 a 1.999

Possibilidades totais = 1.111

Salta terminando no dígito inicial de 2

2 jogos depois de
20 a 29
200 a 299 de
2.000 a 2.999

Possibilidades totais = 1.111

Salta terminando no dígito inicial de 3

3 jogos depois,
30 a 39
300 a 399,
3.000 a 3.999

Possibilidades totais = 1.111

Salta terminando no dígito inicial de 4

4 jogos mais tarde,
40 a
49.400 a 499
4.000 a 4.999

Possibilidades totais = 1.111

Salta terminando no dígito inicial de 5

5 jogos depois de
50 a 59
500 a 599
5.000 a 5.999

Possibilidades totais = 1.111

Salta terminando no dígito inicial de 6

6 jogos depois de
60 a 69
600 a 699 de
6.000 a 6.999

Possibilidades totais = 1.111

Salta que termina no dígito inicial de 7

7 jogos depois de
70 a 79
700 a 799 de
7.000 a 7.999

Possibilidades totais = 1.111

Salta que termina no dígito inicial de 8

8 jogos mais tarde,
80 a 89
800 a 899
8.000 a 8.999

Possibilidades totais = 1.111

Salta terminando no dígito inicial de 9

9 jogos depois,
90 a 99
900 a 999,
9.000 a 9.999

Possibilidades totais = 1.111

Nesta divisão, temos um total de 9 dígitos iniciais, o que nos dá 9 grupos distintos de 1.111 possibilidades cada.   Esses 9 grupos se combinam para nos dar um total de 9.999 possibilidades para qualquer salto de um número Pick 3 direto para terminar. 

Realisticamente, poderíamos estender os intervalos para cada um dos dígitos iniciais ainda mais adicionando o intervalo de 10.000 a 19.999 aos intervalos do dígito inicial e, em seguida, de 20.000 a 29.999 aos intervalos do dígito inicial 2 e assim por diante. 

Isso realmente não é necessário porque, pelo que eu sei, uma sequência de Pick 3 só passou de 10.000 jogos apenas uma vez na história de Pick 3.

Construindo a Amostra

Testar a Escolha 3 quanto à aderência à Lei de Benford é, na verdade, um processo bastante direto.   O primeiro estado que testei foi Ohio. 

Comecei desde o primeiro jogo já realizado, que foi em 12/03/79, e incluí todos os sorteios do Pick 3 até a data do teste (14/10/06). 

Isso me deu um total de 10.626 jogos consecutivos (meio-dia e noite combinados).   Cada jogo na lista recebeu um número de desenho, começando com o primeiro jogo como desenho # 1 e o último ou desenho atual como # 10.626. 

Os resultados foram obviamente listados na ordem em que ocorreram.  Em seguida, a lista foi classificada pelo valor numérico dos combos diretos em ordem crescente (… 012, então 013, então 014 … etc.) E então seu número de desenho correspondente em ordem decrescente.

Isso permitiu que os saltos de cada reta fossem calculados em outra coluna usando o comando IF simples no Excel. 

Supondo que os combos apareçam na coluna F e os números do desenho na coluna G, a fórmula = IF (F2 = F3, G2-G3, G2) verifica se o combo em F2 é o mesmo combo em F3. 

Se for o mesmo combo, então ele subtrai o número do desenho de G3 de G2, efetivamente dando a você o salto do combo em F2 desde o momento de seu último hit. Se o combo em F3 não for igual ao combo em F2, então o número do desenho para o combo em F2 (encontrado na célula G2) é exibido porque isso significa que foi a primeira vez que o combo foi atingido. Nota: o único momento em que os dois combos sendo comparados não seriam realmente iguais um ao outro é quando os dois combos são diferentes.

O comando Preencher é usado a seguir para aplicar a fórmula a todos os jogos da lista classificada.   Abaixo está uma parte muito pequena da lista e como ela aparece depois de ser classificada e a fórmula aplicada:

Uma vez que a fórmula foi preenchida no final da lista e todos os saltos foram calculados, copiei toda a coluna “Saltar” (coluna H) e colei apenas os valores de volta sobre eles mesmos, a fim de remover as fórmulas de cada uma das células, mas ao mesmo tempo, retendo os valores que eles criaram.   Isso foi feito para que eu pudesse reorganizar a lista sem perder os valores de salto.   Re-ordenar a lista não é realmente necessária para o teste, mas que têm uma ligeira compulsão para manter as coisas em ordem em que ocorreu no.   I re-ordenada na lista, seleccionando as colunas B a H e, em seguida, seleccionando D ATA, S ort e, em seguida, escolhendo classificar por “Jogo” A de classificação .  Isso mantém a lista classificada do desenho # 1 ao desenho # 10.626 em ordem de ocorrência e mostra o número de jogos anteriores (pular) em que cada combo acertou pela última vez.   Abaixo está um exemplo da lista reclassificada:

Lendo a lista acima, olhe para o desenho noturno de 12/10/06 (os sorteios noturnos estão na fonte azul claro).   O combo sorteado foi 563, que estava tirando # 10.623.   Na coluna de pular você pode ver que foi sorteado pela última vez 11 jogos antes.   Você pode verificar esse número simplesmente contando até 11 células, onde verá que o combo 563 acabou de ser desenhado durante o desenho # 10.612. Agora que a lista de omissões foi criada, tudo o que precisamos fazer é contar o número de omissões que se enquadram em nossos intervalos específicos de omissões. Executei essa tarefa criando uma planilha diferente que aplicou funções DCOUNT à lista. Depois de concluídas as contagens para cada uma das nove faixas de salto, os totais de cada uma foram divididos pelo total de jogos da amostra (10.626).       Isso dá a porcentagem do total de jogos (de todo o histórico) que cada um dos dígitos iniciais dos saltos representam.

A etapa final em tudo isso é simplesmente representar graficamente os dados para ver o quão próximo o jogo segue a Lei de Benford.   Então, até que ponto o Pick 3 de Ohio o segue?   Observe o gráfico abaixo e veja você mesmo os resultados.

Como você pode ver, está bem perto!   Devo dizer que depois que WIN D fez a primeira postagem sobre a Lei de Benford, eu sabia que ela se aplicaria a jogos de loteria, especialmente o Pick 3.   Eu já estava um pouco familiarizado com o viés, só não sabia exatamente como aplicá-lo.

Ohio não é o único estado em que o Pick 3 segue a Lei de Benford.   Praticamente todos os estados que testei seguem-no igualmente de perto.   Aqui estão mais alguns:

Havia um estado em particular que eu estava ansioso para testar.   Depois de ler como a Lei de Benford pode ser usada para detectar fraudes, achei que seria interessante ver como a loteria INDIANAS se aproximava.   Parece haver muitas suspeitas aqui no LP de que o Indiana Pick 3 e o Pick 4 são manipulados.   Embora eu ainda não tenha testado o jogo Pick 4, o Pick 3 é tão bom quanto qualquer um dos outros estados que testei.   Isso me surpreendeu.   Na verdade, eu esperava descobrir (e provar) que foi manipulado usando a Lei de Benford, que, a propósito, é algo que nem deveria existir em jogos de loteria – LOL!

 

Além dos quatro estados mostrados acima, também testei os Pick 3 de Michigan, Pensilvânia e New Hampshire (Tri-State).   Os gráficos de cada um desses três estados são semelhantes aos acima.   Tenho certeza de que a lei é universal em todos os jogos dos estados e posso quase garantir que todos os jogos de loteria, independentemente do tipo ou das probabilidades, também seguirão a Lei de Benford ao observar os pulos.

 

Há muito mais que pode ser dito sobre a Lei de Benford e como ela se aplica à Loteria.   Em breve estarei adicionando mais informações a este post que entrarão em mais detalhes explicando exatamente por que existe e como pode ser usado como uma estratégia possível.   Também testarei como isso se aplica aos dígitos individuais, aos pares e também às combinações em caixas.

Posts Similares