Lotofácil – Lei de Benford – Análise Combinatória Loterias
“A lei de Benford, também chamada de lei do primeiro dígito, declara que em listas de números de muitas fontes de dados da vida real, o dígito principal é 1 quase um terço do tempo, e números maiores ocorrem como o dígito principal com menos e menos frequência à medida que aumentam em magnitude, a ponto de 9 ser o primeiro dígito a menos de uma vez em vinte.
Este resultado contra-intuitivo se aplica a uma grande variedade de números, incluindo contas de eletricidade, endereços, preços de ações, números da população, taxas de mortalidade, extensões de rios, constantes físicas e matemáticas e processos descritos por leis de energia (que são muito comuns em natureza).
Recebeu o nome do físico Frank Benford, que o declarou em 1938, embora tivesse sido afirmado anteriormente por Simon Newcomb em 1881. A primeira formulação e prova rigorosa parece ser devida a Theodore P. Hill em 1988. ”… Wikipedia.org ( uma enciclopédia online)
De acordo com a Lei de Benford, os dígitos iniciais devem ser distribuídos (na base 10) de acordo com a seguinte expressão:
LOG ((D + 1) / D)
O “D” na expressão significa simplesmente um dígito específico (1-9). Para ver como o dígito “1” deve ser distribuído, a fórmula ficaria assim: log ((1 + 1) / 1). Isso é igual a 0,3010, que é 30,10%. Para o dígito “2”, a fórmula seria log ((2 + 1) / 2) … isso é igual a 0,1761 ou 17,61%.
Quando usamos a fórmula para calcular as distribuições de todos os dígitos de 1 a 9, obtemos a seguinte tabela:
Dígito | Frequência | Por cento |
1 | 0,3010 | 30,10% |
2 | 0,1761 | 17,61% |
3 | 0,1249 | 12,49% |
4 | 0,0969 | 9,69% |
5 | 0,0792 | 7,92% |
6 | 0,0669 | 6,69% |
7 | 0,0580 | 5,80% |
8 | 0,0512 | 5,12% |
9 | 0,0458 | 4,58% |
Como a tabela indica, os dígitos iniciais encontrados em uma grande amostra de dados estatísticos serão distribuídos de forma muito desigual … com muito mais números começando com o dígito um do que com o dígito nove! Exatamente por que isso ocorre, pode ser atribuído à probabilidade de probabilidade.
A Lei de Benford é intrigante em suas muitas aplicações possíveis.
Um de seus usos mais interessantes é o de detecção de fraudes!
Isso é feito simplesmente medindo os valores de uma grande série de dados em relação aos resultados esperados calculados pela Lei de Benford.
Leia os três links a seguir para obter uma melhor compreensão do que é a Lei de Benford e como ela é usada … preste atenção especial em como esses sites implicam que a Lei de Benford NÃO se aplica à loteria … Então volte e leia o resto deste publicar.
http://plus.maths.org/issue9/features/benford/index.html
http://ddrive.cs.dal.ca:9999/page/lvl3/13
Os artigos basicamente insinuam que você não deve ficar tentado a jogar combinações que começam com o dígito 1 só porque a Lei de Benford diz que o dígito 1 deve ocorrer com muito mais frequência do que os outros dígitos … “O resultado da loteria como Lotofácil, Mega Sena é verdadeiramente aleatório, o que significa que cada número de loteria possível tem uma chance igual de ocorrer.
As frequências dos dígitos iniciais devem, portanto, a longo prazo, estar na proporção exata do número de números da loteria começando com aquele dígito. ” … PLUS.MATHS.ORG
Se você olhar para as frequências dos dígitos com base no dígito real impresso nas bolas, então sim, eles aparecerão quase uniformemente em todo o espectro em uma proporção que é igual ao número de combinações que começam com aquele dígito.
Este é um acéfalo para a maioria dos jogadores de loteria. É claro que cada bola e / ou combinação aparecerá quase igualmente por um longo período de tempo! Duh!
No entanto, quando se percebe que os números nas bolas nada mais são do que simples imagens e que o tempo entre as ocorrências das imagens é mais importante do que as próprias imagens, então pode-se entender que a probabilidade de probabilidade é mais controladora para o jogo do que a própria aleatoriedade.
Com isso em mente, a Lei de Benford se aplica a jogos de loteria e aqui está como podemos observá-la:
Primeiro, você deve desconsiderar os números reais nas bolas, pelo menos na medida em que a frequência dos números reais não é o que você está rastreando. No Pick 3, não esperamos que o dígito 1 seja desenhado com mais freqüência do que o dígito 8.
Também não esperamos que um combo como 137 seja desenhado mais do que o combo 589 só porque o combo 137 começa com um dígito inicial de 1. O que realmente queremos rastrear é o tempo entre os acertos do número nas bolas ou as combinações que eles compõem!
Em outras palavras, queremos rastrear os saltos, não os números das bolas em si … é aqui que a Lei dos Primeiros Dígitos de Benford existe na loteria!
É realmente tudo sobre sucessos e saltos.
Ao aplicar a Lei de Benford aos saltos, primeiro temos que delinear as possibilidades dos saltos. Isso é muito simples, pois o que estamos rastreando será o dígito inicial de uma extremidade de salto. De acordo com a “Lei”, devemos ver cerca de 30,10% de todos os saltos terminarem com um valor de dígito inicial de 1 (se o que estou dizendo sobre a aplicação de “A Lei” aos saltos for verdade).
Portanto, primeiro precisamos descobrir quantos saltos possíveis existem e onde todos eles terminam.
Vamos supor que o último número do Pick 3 direto sorteado foi 764.
Quando será a próxima vez que ele poderá ser sorteado? Pode ser empatado no próximo jogo, que é um jogo depois, ou uma repetição consecutiva. Pode ser empatado dois jogos depois.
Na verdade, pode muito bem esperar milhares ou até mais! O ponto aqui é que existem certos intervalos para saltos até o fim que contêm o mesmo dígito inicial. Devo salientar que zero é um dígito inicial impossível para um salto terminar neste ambiente.
Se um número direto acertar e depois repetir e acertar o próximo jogo, não é contado como um salto de zero, mas ao invés disso, diz-se que acertou exatamente um jogo após seu último acerto, que é registrado como 1.
Portanto, para todos os efeitos, os pulos terminarão com os dígitos iniciais de 1 a 9. Aqui está como os intervalos para todos os pulos são divididos na Escolha 3:
Salta terminando no dígito inicial de 1
1 jogo depois de
10 a 19
100 a 199
1.000 a 1.999
Possibilidades totais = 1.111
Salta terminando no dígito inicial de 2
2 jogos depois de
20 a 29
200 a 299 de
2.000 a 2.999
Possibilidades totais = 1.111
Salta terminando no dígito inicial de 3
3 jogos depois,
30 a 39
300 a 399,
3.000 a 3.999
Possibilidades totais = 1.111
Salta terminando no dígito inicial de 4
4 jogos mais tarde,
40 a
49.400 a 499
4.000 a 4.999
Possibilidades totais = 1.111
Salta terminando no dígito inicial de 5
5 jogos depois de
50 a 59
500 a 599
5.000 a 5.999
Possibilidades totais = 1.111
Salta terminando no dígito inicial de 6
6 jogos depois de
60 a 69
600 a 699 de
6.000 a 6.999
Possibilidades totais = 1.111
Salta que termina no dígito inicial de 7
7 jogos depois de
70 a 79
700 a 799 de
7.000 a 7.999
Possibilidades totais = 1.111
Salta que termina no dígito inicial de 8
8 jogos mais tarde,
80 a 89
800 a 899
8.000 a 8.999
Possibilidades totais = 1.111
Salta terminando no dígito inicial de 9
9 jogos depois,
90 a 99
900 a 999,
9.000 a 9.999
Possibilidades totais = 1.111
Nesta divisão, temos um total de 9 dígitos iniciais, o que nos dá 9 grupos distintos de 1.111 possibilidades cada. Esses 9 grupos se combinam para nos dar um total de 9.999 possibilidades para qualquer salto de um número Pick 3 direto para terminar.
Realisticamente, poderíamos estender os intervalos para cada um dos dígitos iniciais ainda mais adicionando o intervalo de 10.000 a 19.999 aos intervalos do dígito inicial e, em seguida, de 20.000 a 29.999 aos intervalos do dígito inicial 2 e assim por diante.
Isso realmente não é necessário porque, pelo que eu sei, uma sequência de Pick 3 só passou de 10.000 jogos apenas uma vez na história de Pick 3.
Construindo a Amostra
Testar a Escolha 3 quanto à aderência à Lei de Benford é, na verdade, um processo bastante direto. O primeiro estado que testei foi Ohio.
Comecei desde o primeiro jogo já realizado, que foi em 12/03/79, e incluí todos os sorteios do Pick 3 até a data do teste (14/10/06).
Isso me deu um total de 10.626 jogos consecutivos (meio-dia e noite combinados). Cada jogo na lista recebeu um número de desenho, começando com o primeiro jogo como desenho # 1 e o último ou desenho atual como # 10.626.
Os resultados foram obviamente listados na ordem em que ocorreram. Em seguida, a lista foi classificada pelo valor numérico dos combos diretos em ordem crescente (… 012, então 013, então 014 … etc.) E então seu número de desenho correspondente em ordem decrescente.
Isso permitiu que os saltos de cada reta fossem calculados em outra coluna usando o comando IF simples no Excel.
Supondo que os combos apareçam na coluna F e os números do desenho na coluna G, a fórmula = IF (F2 = F3, G2-G3, G2) verifica se o combo em F2 é o mesmo combo em F3.
Se for o mesmo combo, então ele subtrai o número do desenho de G3 de G2, efetivamente dando a você o salto do combo em F2 desde o momento de seu último hit. Se o combo em F3 não for igual ao combo em F2, então o número do desenho para o combo em F2 (encontrado na célula G2) é exibido porque isso significa que foi a primeira vez que o combo foi atingido. Nota: o único momento em que os dois combos sendo comparados não seriam realmente iguais um ao outro é quando os dois combos são diferentes.
O comando Preencher é usado a seguir para aplicar a fórmula a todos os jogos da lista classificada. Abaixo está uma parte muito pequena da lista e como ela aparece depois de ser classificada e a fórmula aplicada:
Uma vez que a fórmula foi preenchida no final da lista e todos os saltos foram calculados, copiei toda a coluna “Saltar” (coluna H) e colei apenas os valores de volta sobre eles mesmos, a fim de remover as fórmulas de cada uma das células, mas ao mesmo tempo, retendo os valores que eles criaram. Isso foi feito para que eu pudesse reorganizar a lista sem perder os valores de salto. Re-ordenar a lista não é realmente necessária para o teste, mas que têm uma ligeira compulsão para manter as coisas em ordem em que ocorreu no. I re-ordenada na lista, seleccionando as colunas B a H e, em seguida, seleccionando D ATA, S ort e, em seguida, escolhendo classificar por “Jogo” A de classificação . Isso mantém a lista classificada do desenho # 1 ao desenho # 10.626 em ordem de ocorrência e mostra o número de jogos anteriores (pular) em que cada combo acertou pela última vez. Abaixo está um exemplo da lista reclassificada:
Lendo a lista acima, olhe para o desenho noturno de 12/10/06 (os sorteios noturnos estão na fonte azul claro). O combo sorteado foi 563, que estava tirando # 10.623. Na coluna de pular você pode ver que foi sorteado pela última vez 11 jogos antes. Você pode verificar esse número simplesmente contando até 11 células, onde verá que o combo 563 acabou de ser desenhado durante o desenho # 10.612. Agora que a lista de omissões foi criada, tudo o que precisamos fazer é contar o número de omissões que se enquadram em nossos intervalos específicos de omissões. Executei essa tarefa criando uma planilha diferente que aplicou funções DCOUNT à lista. Depois de concluídas as contagens para cada uma das nove faixas de salto, os totais de cada uma foram divididos pelo total de jogos da amostra (10.626). Isso dá a porcentagem do total de jogos (de todo o histórico) que cada um dos dígitos iniciais dos saltos representam.
A etapa final em tudo isso é simplesmente representar graficamente os dados para ver o quão próximo o jogo segue a Lei de Benford. Então, até que ponto o Pick 3 de Ohio o segue? Observe o gráfico abaixo e veja você mesmo os resultados.
Como você pode ver, está bem perto! Devo dizer que depois que WIN D fez a primeira postagem sobre a Lei de Benford, eu sabia que ela se aplicaria a jogos de loteria, especialmente o Pick 3. Eu já estava um pouco familiarizado com o viés, só não sabia exatamente como aplicá-lo.
Ohio não é o único estado em que o Pick 3 segue a Lei de Benford. Praticamente todos os estados que testei seguem-no igualmente de perto. Aqui estão mais alguns:
Havia um estado em particular que eu estava ansioso para testar. Depois de ler como a Lei de Benford pode ser usada para detectar fraudes, achei que seria interessante ver como a loteria INDIANAS se aproximava. Parece haver muitas suspeitas aqui no LP de que o Indiana Pick 3 e o Pick 4 são manipulados. Embora eu ainda não tenha testado o jogo Pick 4, o Pick 3 é tão bom quanto qualquer um dos outros estados que testei. Isso me surpreendeu. Na verdade, eu esperava descobrir (e provar) que foi manipulado usando a Lei de Benford, que, a propósito, é algo que nem deveria existir em jogos de loteria – LOL!
Além dos quatro estados mostrados acima, também testei os Pick 3 de Michigan, Pensilvânia e New Hampshire (Tri-State). Os gráficos de cada um desses três estados são semelhantes aos acima. Tenho certeza de que a lei é universal em todos os jogos dos estados e posso quase garantir que todos os jogos de loteria, independentemente do tipo ou das probabilidades, também seguirão a Lei de Benford ao observar os pulos.
Há muito mais que pode ser dito sobre a Lei de Benford e como ela se aplica à Loteria. Em breve estarei adicionando mais informações a este post que entrarão em mais detalhes explicando exatamente por que existe e como pode ser usado como uma estratégia possível. Também testarei como isso se aplica aos dígitos individuais, aos pares e também às combinações em caixas.