<?xml version="1.0" encoding="UTF-8"?><rss version="2.0"
	xmlns:content="http://purl.org/rss/1.0/modules/content/"
	xmlns:wfw="http://wellformedweb.org/CommentAPI/"
	xmlns:dc="http://purl.org/dc/elements/1.1/"
	xmlns:atom="http://www.w3.org/2005/Atom"
	xmlns:sy="http://purl.org/rss/1.0/modules/syndication/"
	xmlns:slash="http://purl.org/rss/1.0/modules/slash/"
	>

<channel>
	<title>Arquivo de Probabilidade - Data Universe</title>
	<atom:link href="https://datauniverse.com.br/category/probabilidade/feed/" rel="self" type="application/rss+xml" />
	<link>https://datauniverse.com.br/category/probabilidade/</link>
	<description>Conteúdos sobre as áreas de Data Science, Data Analytics, Estatística e Probabilidade, Inteligência Artificial e Machine Learning.</description>
	<lastBuildDate>Wed, 06 Sep 2023 22:27:19 +0000</lastBuildDate>
	<language>pt-BR</language>
	<sy:updatePeriod>
	hourly	</sy:updatePeriod>
	<sy:updateFrequency>
	1	</sy:updateFrequency>
	<generator>https://wordpress.org/?v=6.9.4</generator>

<image>
	<url>https://datauniverse.com.br/wp-content/uploads/2026/01/cropped-data-universe-logo-icon-32x32.png</url>
	<title>Arquivo de Probabilidade - Data Universe</title>
	<link>https://datauniverse.com.br/category/probabilidade/</link>
	<width>32</width>
	<height>32</height>
</image> 
	<item>
		<title>A falácia do promotor e o teorema de Bayes</title>
		<link>https://datauniverse.com.br/a-falacia-do-promotor-e-o-teorema-de-bayes/</link>
					<comments>https://datauniverse.com.br/a-falacia-do-promotor-e-o-teorema-de-bayes/#respond</comments>
		
		<dc:creator><![CDATA[Alexandre Polselli]]></dc:creator>
		<pubDate>Wed, 12 Apr 2023 21:07:02 +0000</pubDate>
				<category><![CDATA[Probabilidade]]></category>
		<guid isPermaLink="false">https://alexandrepolselli.com.br/?p=1410</guid>

					<description><![CDATA[<p>Em uma manhã do ano de 1968, por volta das 11h30, Juanita Brooks estava voltando para casa depois de fazer compras. Enquanto ela caminhava por um beco, alguém a empurrou para o chão e pegou sua bolsa. Quando ela olhou para cima, ela viu uma jovem branca com cabelos loiros fugindo. Um vizinho relatou que [&#8230;]</p>
<p>O post <a href="https://datauniverse.com.br/a-falacia-do-promotor-e-o-teorema-de-bayes/">A falácia do promotor e o teorema de Bayes</a> apareceu primeiro em <a href="https://datauniverse.com.br">Data Universe</a>.</p>
]]></description>
										<content:encoded><![CDATA[
<p>Em uma manhã do ano de 1968, por volta das 11h30, Juanita Brooks estava voltando para casa depois de fazer compras. Enquanto ela caminhava por um beco, alguém a empurrou para o chão e pegou sua bolsa. Quando ela olhou para cima, ela viu uma jovem branca com cabelos loiros fugindo. </p>



<p>Um vizinho relatou que viu uma mulher branca com cabelos loiros em um rabo de cavalo sair correndo do beco e entrar em um carro amarelo. O carro, dirigido por um homem afro-americano de bigode e barba, acelerou e fugiu daquela cena.</p>



<p>Um policial com as característica e a pista acima foi à casa de um casal tido como suspeito chamados de Malcolm e Janet Collins quatro dias depois e viu um carro amarelo estacionado ali. Ao interrogar o casal, viu Janet, que era branca, tinha cabelos loiros escuros presos em um rabo de cavalo. Malcolm, que era afro-americano, tinha bigode e disse que às vezes usava barba, mas a havia raspado três semanas antes. </p>



<p>Janet disse que, no dia do roubo, ela trabalhava como empregada doméstica em um endereço próximo ao local do roubo, mas estava trabalhando no momento do ato. A mulher para quem Janet trabalhava, no entanto, disse que Janet saiu do trabalho por volta das 11h30 e foi buscada por Malcolm em um carro amarelo.</p>



<p>Os Collinses foram acusados de roubo em segundo grau no tribunal estadual. Eles se declararam inocentes e tiveram um julgamento com júri conjunto. No julgamento, o caso da promotoria foi baseado em grande parte em evidências de que as aparições de Janet e Malcolm em seu carro correspondiam à descrição das testemunhas oculares dos perpetradores e seu carro de fuga.</p>



<p>Para reforçar essa evidência circunstancial, o promotor chamou um professor de matemática da faculdade, que contou aos jurados sobre o conceito estatístico chamado regra do produto. Essa regra estabelece que a <strong>probabilidade da ocorrência conjunta de múltiplos fatores mutuamente independentes é igual ao produto das probabilidades individuais de todos os fatores. </strong></p>



<p>O promotor então pediu ao professor que usasse a regra para calcular a probabilidade das características relevantes com base nas suposições fornecidas pelo promotor. Essas suposições incluíam:</p>



<figure class="wp-block-image aligncenter size-large"><img decoding="async" src="https://alexandrepolselli.com.br/wp-content/uploads/2023/04/image-7.png" alt="" class="wp-image-1411"/></figure>



<p>A probabilidade combinada de todos esses eventos é de <strong>P (A∩B) = P (A)*P (B)</strong> o que resulta em 0,000000083 ou 1 em 12 milhões.</p>



<p>O promotor não ofereceu nenhuma evidência para apoiar as probabilidades dos vários fatores individuais que ele forneceu. Com base nessas suposições, e na probabilidade calculada pelo professor, o tribunal de primeira instância rejeitou a objeção do advogado de defesa ao testemunho do professor e o júri condenou os Collins. Michael apelou então para a Suprema Corte da Califórnia.</p>



<h2 class="wp-block-heading"><strong>Prosecutor&#8217;s fallacy (falácia do promotor)</strong></h2>



<p>A Suprema Corte da Califórnia anulou a condenação, criticando o raciocínio estatístico por ignorar dependências entre as características, por exemplo, homens barbudos geralmente usam bigodes, e portanto os fatores nesse caso não seriam totalmente independentes, mas mútuos.</p>



<p>O tribunal observou que a inferência estatística correta seria a probabilidade de que nenhum outro casal que pudesse ter cometido tal roubo tivesse as mesmas características dos réus, dado que pelo menos um casal tinha as características identificadas. O tribunal observou, em um apêndice à sua decisão, que usando essa inferência estatística, mesmo que as estatísticas do promotor fossem todas corretas e independentes como ele presumia, a probabilidade de os réus serem inocentes seria superior a 40%.</p>



<p>Essa inferência equivocada, comumente chamada de <strong>Prosecutor&#8217;s fallacy (falácia do promotor)</strong>, iguala incorretamente a probabilidade de que um réu aleatório tenha certas características com a chance de que o réu seja culpado.</p>



<p>Esse nome advém do uso comum por promotores para exagerar a probabilidade de culpa de um réu criminal. A falácia também pode ser usada para apoiar outras alegações, incluindo a inocência de um réu.</p>



<p>Tal falácia é uma falha do raciocínio estatístico envolvendo um teste para uma ocorrência, como uma correspondência de DNA por exemplo. Um resultado positivo no teste pode paradoxalmente ser mais provável de ser um resultado errôneo do que uma ocorrência real, mesmo que o teste seja muito preciso.</p>



<p>A falácia básica resulta do mal entendimento sobre <strong>probabilidade condicional</strong> e da negligência das probabilidades anteriores de um réu ser culpado antes que a evidência fosse apresentada. Quando um promotor coleta algumas evidências (por exemplo, uma correspondência de DNA) e faz um especialista testemunhar que a probabilidade de encontrar essas evidências se o acusado for inocente é pequena, a falácia ocorre se for concluído que a probabilidade de o acusado ser inocente deve ser comparativamente pequena.</p>



<figure class="wp-block-image aligncenter is-resized"><img fetchpriority="high" decoding="async" src="https://upload.wikimedia.org/wikipedia/commons/thumb/4/4d/Prosecutor_fallacy.svg/1280px-Prosecutor_fallacy.svg.png" alt="undefined" style="width:489px;height:387px" width="489" height="387"/><figcaption class="wp-element-caption">imagem: <a href="https://commons.wikimedia.org/wiki/User:Cmglee" target="_blank" rel="noreferrer noopener">cmglee</a></figcaption></figure>



<p>Neste gráfico acima, para ilustrar a ocasião, a hipótese é a possibilidade de o réu ser culpado, enquanto as evidências encontradas se referem a um resultado positivo de teste, como DNA ou tipo sanguíneo compatível. Embora a probabilidade de encontrar evidências do verdadeiro culpado possa ser bastante alta (nesse caso, dois quintos, ou 40%), a probabilidade de um determinado indivíduo ser culpado dado que neles foram encontradas tais provas não tem relação com a primeira, e muitas vezes será muito menor (nesse exemplo, apenas dois oitavos, ou 25%).</p>



<p>Se a correspondência de DNA for usada para confirmar a culpa da qual se suspeita, então é de fato uma forte evidência. No entanto, se a evidência de DNA for a única evidência contra o acusado e o acusado foi escolhido em um grande banco de dados de perfis de DNA, as chances de a correspondência ser feita aleatoriamente podem ser aumentadas e menos prejudiciais ao réu. <strong>As probabilidades neste cenário não se relacionam com as probabilidades de ser culpado, mas sim com as probabilidades de ser escolhido aleatoriamente.</strong></p>



<p>Por exemplo, se o autor de um crime for conhecido por ter o mesmo tipo sanguíneo de um determinado réu e 10% da população compartilhar esse tipo sanguíneo, então uma versão da falácia do promotor seria alegar que, <strong>com base apenas nisso</strong>, a probabilidade que o réu é culpado é de 90%. </p>



<p>No entanto, esta conclusão só está próxima de correta <strong>se o réu foi selecionado como o principal suspeito com base em evidências robustas descobertas antes do exame de sangue e não relacionadas a ele</strong> (a correspondência de sangue pode então ser uma &#8220;coincidência inesperada&#8221;). Caso contrário, o raciocínio apresentado é falho, pois ignora a alta probabilidade anterior (isto é, antes do exame de sangue) de que ele seja uma pessoa inocente aleatória.</p>



<p>Suponha, por exemplo, que 1.000 pessoas vivam na cidade onde ocorreu um assassinato. Isso significa que vivem lá 100 pessoas que têm o tipo de sangue do assassino; portanto, a verdadeira probabilidade de que o réu seja culpado – com base no fato de que seu tipo de sangue corresponde ao do assassino – é de apenas 1%, muito menos do que os 90% argumentados pelo promotor.</p>



<h2 class="wp-block-heading">Falácia do Argumento da raridade</h2>



<p>Suponha que um ganhador da Mega Sena é acusado de trapacear, com base na improbabilidade de ganhar. No julgamento, o promotor calcula a probabilidade <strong>1 em 50.063.000</strong> de ganhar na loteria sem trapacear e argumenta que essa é a probabilidade de inocência. </p>



<p>A falha lógica é que o promotor não conseguiu explicar o grande número de pessoas que jogam na loteria. Embora a probabilidade de qualquer pessoa ganhar seja bastante baixa, a probabilidade de qualquer pessoa ganhar na loteria, dado o número de pessoas que jogam, é muito alta.</p>



<p>A correta utilização das estatísticas probabilísticas nesses casos então, é somente reforçar uma pré existente suspeita forte contra um réu e nunca utilizar a baixa probabilidade de inocência / culpa como argumento primário na decisão judicial.</p>



<p>Por conta desse erro de interpretação, por volta de 1996, quatro mães britânicas foram presas por assassinato porque dois ou mais de seus bebês morreram em seus berços. Três das mães foram condenadas e sentenciadas à prisão perpétua. No entanto, em 2006, todas as quatro mães foram declaradas inocentes de crimes que nunca haviam ocorrido.</p>



<h2 class="wp-block-heading">O caso de Sally Clark e o teorema de Bayes</h2>



<p>Sally Clark, uma advogada que perdeu seu primeiro filho com 11 semanas e o segundo com 8 semanas, foi condenada em 1999. Um proeminente pediatra, Sir Roy Meadow, testemunhou na acusação sobre a Síndrome da Morte Súbita Infantil, conhecida como SIDS nos Estados Unidos e morte no berço na Grã-Bretanha. Citando um estudo do governo, Meadow disse que a incidência de morte por SIDS era de uma em 8.500 em uma família como a de Clark (estável, rica, não fumante, com uma mãe com mais de 26 anos).</p>



<p>No entanto, apesar do fato de algumas famílias serem predispostas à SIDS, Meadow presumiu erroneamente que a morte de cada irmão ocorreu independentemente da outra. </p>



<p>Calculando a probabilidade conjunta de <strong>P (A∩B) = 8.500 * 8.500 = 72.250.000</strong> chegou a conclusão que a chance de duas crianças morrerem em uma família como a de Sally Clark era tão rara (1/72.250.000) que era mais provável que elas tivessem sido assassinadas.</p>



<p>Porém nesse e em muitos outros casos, uma simples probabilidade conjunta não é evidência suficiente para suportar a hipótese de culpa ou inocência de um réu, é para isso que existe a ferramenta da análise bayesiana, a qual teria mostrado que as crianças provavelmente morreram de SIDS.</p>



<p>O Teorema de Bayes, em homenagem ao matemático britânico do século XVIII Thomas Bayes, é uma fórmula matemática para determinar a <strong>probabilidade condicional</strong>. Probabilidade condicional é a probabilidade de um resultado ocorrer, com base em um resultado anterior ocorrido em circunstâncias semelhantes. O teorema de Bayes fornece uma maneira de revisar previsões ou teorias existentes (atualizar probabilidades) dadas evidências novas ou adicionais.</p>



<figure class="wp-block-image aligncenter"><img decoding="async" src="https://upload.wikimedia.org/wikipedia/commons/9/9c/Probability_tree_diagram.svg" alt="Diagrama de árvore – Wikipédia, a enciclopédia livre"/></figure>



<p>Através de uma árvore de probabilidades, nós atualizamos ou revisamos as previsões de cada nó de acordo com as evidências posteriores:</p>



<figure class="wp-block-image aligncenter size-large is-resized"><img decoding="async" src="https://alexandrepolselli.com.br/wp-content/uploads/2023/04/image-8-1024x570.png" alt="" class="wp-image-1420" style="width:560px;height:311px" width="560" height="311"/></figure>



<p>Assim, a questão perante o tribunal deveria ter sido: os bebês provavelmente morreram de causas naturais ou assassinato?</p>



<p>Primeiro, examinamos as causas naturais da morte infantil súbita. A chance de um bebê aleatório morrer de SIDS era de cerca de 1 em 1.300 durante esse período na Grã-Bretanha. O argumento de Meadow era falho e produzia uma chance muito menor de morte natural. As probabilidades estimadas de uma segunda morte por SIDS na mesma família eram muito maiores, talvez uma em 100, porque os membros da família podem compartilhar uma predisposição ambiental ou genética comum para SIDS.</p>



<p>Em segundo lugar, nos voltamos para a hipótese de que os bebês foram assassinados. Apenas cerca de 30 crianças de 650.000 nascimentos anuais na Inglaterra, Escócia e País de Gales foram assassinadas por suas mães. O número de duplos assassinatos deve ser muito menos provável, estimado em 10 vezes menos provável.</p>



<p>Segundo a fórmula de Bayes:</p>



<figure class="wp-block-image aligncenter"><img decoding="async" src="https://wikimedia.org/api/rest_v1/media/math/render/svg/87c061fe1c7430a5201eef3fa50f9d00eac78810" alt="{\displaystyle P(A\mid B)={\frac {P(B\mid A)P(A)}{P(B)}}}"/></figure>



<p>Tomamos a hipótese &#8220;H&#8221; a ser atualizada como sendo: os dois filhos de Sally Clark morreram de SIDS. O dado &#8220;D&#8221; será que ambas as crianças morreram repentina e inesperadamente. As probabilidades iniciais que entram na regra de Bayes são P(H) e seu oposto, P(nãoH). Como discutido acima, P(H) é considerado como tendo o valor</p>



<p><strong>P(H) = 1/1300 × 1/100 = 0,0000077</strong></p>



<p>A alternativa P(nãoH) é então dada por</p>



<p><strong>P(nãoH) = 1 &#8211; P(H) = 0,9999923</strong></p>



<p>Agora olhamos para os dados. Ele figura nas probabilidades <strong>P(D | H) e P(D | nãoH).</strong> O primeiro é igual a um, pois é a probabilidade de as crianças terem morrido repentina e inesperadamente, dado que morreram de SIDS. <strong>P(D | nãoH)</strong> é a probabilidade de que um par aleatório de irmãos morra repentina e inesperadamente, mas não de SIDS. A promotoria vai equiparar isso a assassinato. A estimativa feita no parágrafo acima foi</p>



<p><strong>P(D | nãoH) = 30/650000 × 1/10 = 0,0000046.</strong></p>



<p>O objetivo é estimar <strong>P(H | D)</strong>, a probabilidade de que a causa da morte tenha sido SIDS, dadas suas mortes inexplicáveis.</p>



<p><strong>P(H | D) = 1 × 0.0000077 / 1 × 0.0000077 + 0.999992 × 0.0000046 ≈ 0.6</strong></p>



<p>Concluímos então que é mais provável que as crianças tenham morrido de SIDS</p>



<h2 class="wp-block-heading">Conclusão</h2>



<p>A falácia do promotor acabou ficando muito famosa principalmente pelo impacto negativo que o mau uso das ferramentas e da interpretação estatística causou na vida de diversas mulheres nos Estados Unidos. </p>



<p>Considerando que esses casos ganharam notoriedade e atenção da mídia, poderíamos imaginar quantas pessoas já foram injustiçadas por falácias no tribunal de justiça.</p>



<p>Entendendo a falácia do argumento de raridade, fica mais claro o quão injusto e incorreto é cometer o erro da falácia do promotor utilizando deste argumento pois o simples fato de uma probabilidade ser baixa não deve ser entendida como a probabilidade remota de inocência de um réu, mas deve ser entendida apenas e somente como a probabilidade daquele evento ocorrer aleatoriamente. Deve ser conciliado a isso o fato de que quando analisamos as probabilidades de um universo com uma população de um país inteiro, calcular a probabilidade de qualquer evento deve retornar números extremamente baixos, pois são muitas as variáveis que se cruzam em eventos aleatórios.</p>



<p>O que é importante levar de tudo isso é que a estatística deve ser utilizada como um argumento complementar no julgamento de réus e nunca como uma prova definitiva de um evento.</p>



<p>Referências:</p>



<ul class="wp-block-list">
<li><a href="https://www.courtlistener.com/opinion/1207456/people-v-collins/" target="_blank" rel="noreferrer noopener">https://www.courtlistener.com/opinion/1207456/people-v-collins/</a></li>



<li><a href="https://en.wikipedia.org/wiki/Prosecutor%27s_fallacy" target="_blank" rel="noreferrer noopener">https://en.wikipedia.org/wiki/Prosecutor%27s_fallacy</a></li>



<li><a href="https://plato.stanford.edu/entries/bayes-theorem/" target="_blank" rel="noreferrer noopener">https://plato.stanford.edu/entries/bayes-theorem/</a></li>



<li><a href="https://www.ncbi.nlm.nih.gov/pmc/articles/PMC539414/" target="_blank" rel="noreferrer noopener">https://www.ncbi.nlm.nih.gov/pmc/articles/PMC539414/</a></li>



<li><a href="https://www.mcgrayne.com/disc.htm" target="_blank" rel="noreferrer noopener">https://www.mcgrayne.com/disc.htm</a></li>
</ul>
<p>O post <a href="https://datauniverse.com.br/a-falacia-do-promotor-e-o-teorema-de-bayes/">A falácia do promotor e o teorema de Bayes</a> apareceu primeiro em <a href="https://datauniverse.com.br">Data Universe</a>.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://datauniverse.com.br/a-falacia-do-promotor-e-o-teorema-de-bayes/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
		<item>
		<title>Mega-Sena: Um estudo sobre probabilidades e combinações</title>
		<link>https://datauniverse.com.br/mega-sena-um-estudo-sobre-probabilidades-e-combinacoes/</link>
					<comments>https://datauniverse.com.br/mega-sena-um-estudo-sobre-probabilidades-e-combinacoes/#respond</comments>
		
		<dc:creator><![CDATA[Alexandre Polselli]]></dc:creator>
		<pubDate>Wed, 15 Mar 2023 22:23:42 +0000</pubDate>
				<category><![CDATA[Probabilidade]]></category>
		<guid isPermaLink="false">https://alexandrepolselli.com.br/?p=1264</guid>

					<description><![CDATA[<p>Todos os anos, milhões de pessoas investem seus recursos financeiros apostando na mega-sena acreditando que as probabilidades estão a seu favor. Segundo uma base, desde o ano de 1996, houveram mais de 6.203.412.494 de apostas até o ano de 2023. Nesse sentido, decidi levantar algumas questões como: Regras do Mega-Sena O conjunto de cada volante [&#8230;]</p>
<p>O post <a href="https://datauniverse.com.br/mega-sena-um-estudo-sobre-probabilidades-e-combinacoes/">Mega-Sena: Um estudo sobre probabilidades e combinações</a> apareceu primeiro em <a href="https://datauniverse.com.br">Data Universe</a>.</p>
]]></description>
										<content:encoded><![CDATA[
<p>Todos os anos, milhões de pessoas investem seus recursos financeiros apostando na mega-sena acreditando que as probabilidades estão a seu favor. Segundo <a href="https://redeloteria.com.br/mega-sena/todos-os-resultados-da-mega-sena/29275" target="_blank" rel="noreferrer noopener">uma base</a>, desde o ano de 1996, houveram mais de 6.203.412.494 de apostas até o ano de 2023. Nesse sentido, decidi levantar algumas questões como: </p>



<ol class="wp-block-list">
<li>Quais são as reais probabilidades de vitória de todas as categorias de apostas que envolvem a mega-sena, como a quina, quadra e todas as faixas de dezenas?</li>



<li>Existe alguma real vantagem financeira em fazer apostas com mais dezenas?</li>



<li>Quanto dinheiro seria necessário investir para aumentar ao máximo as chances de uma vitória provavelmente certeira?</li>
</ol>



<h2 class="wp-block-heading">Regras do Mega-Sena</h2>



<p>O conjunto de cada volante é composto por 60 números (chamados de dezenas), das quais o jogador deve escolher uma quantidade X para realizar um jogo que pode variar de 6 a 20 dezenas.</p>



<p>Um jogo padrão (ou simples) consiste em escolher 6 dezenas e a cada número adicional escolhido, você aumenta suas chances de vitória, ao passo que também aumenta o custo da aposta progressivamente.&nbsp;</p>



<p>Se o apostador, por exemplo, escolher 15 números, ele ganhará se 6 dentre esses 15 números forem os sorteados. Há prêmios também para a quina (5 acertos) e a quadra (4 acertos) que são menores obviamente.</p>



<p>Você pode deixar que o sistema escolha os números para você (Surpresinha) e/ou concorrer com a mesma aposta por 2, 4 ou 8 concursos consecutivos (Teimosinha).</p>



<p>A forma mais acessível de incrementar a probabilidade de vencer é apostar em bolões da Mega-Sena. </p>



<p class="has-text-align-center"> <br><img decoding="async" width="291" height="495" src="https://lh6.googleusercontent.com/3Lzh0WU0vPf_62aBS17mRD8pziwkXZ7vknGEJ5fKTyMPico4NCMeK_Gi2Kq5ImeVMOB0niV9_hKPEtmbM348IVrJbjI3lb9kVrlzLgoQkDVricK1Hq0Wthj-LkAngumWZxd_5JyVagiRkP5VHDjSysI"></p>



<h2 class="wp-block-heading">Premiação</h2>



<p>O prêmio bruto corresponde a 43,35% da arrecadação. Dessa porcentagem:</p>



<ul class="wp-block-list">
<li>35% são distribuídos entre os acertadores dos 6 números sorteados (Sena);</li>



<li>19% entre os acertadores de 5 números (Quina);</li>



<li>19% entre os acertadores de 4 números (Quadra);</li>



<li>22% ficam acumulados e são distribuídos aos acertadores dos 6 números nos concursos de final 0 ou 5.</li>



<li>5% ficam acumulados para a primeira faixa &#8211; sena &#8211; do último concurso do ano de final 0 ou 5 (Mega da Virada).</li>
</ul>



<h2 class="wp-block-heading">Estruturando o cálculo da probabilidade</h2>



<p>Em primeiro lugar, como calculamos a probabilidade de vitória de cada tipo de jogo levando em consideração desde o jogo mais simples até os jogos com mais dezenas?</p>



<p>Como não importa a ordem em que esses números são sorteados, o cálculo da quantidade total de resultados possíveis é feito por meio de uma combinação de 60 elementos tomados 6 a 6 até 20 a 20.</p>



<p>Dessa forma, a seleção do conjunto {1, 2, 3, 4, 5, 6} para essa análise, significa o mesmo que {2, 3, 4, 1, 5, 6} assim como a seleção do conjunto {1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12, 13, 14, 15, 16, 17, 18, 19, 20}  significa o mesmo que {2, 3, 4, 1, 5, 6, 20, 17, 10, 9, 8, 7, 16, 14, 15, 18, 19, 11, 12, 13}</p>



<p>Então primeiro calculamos quantas combinações podemos formar escolhendo 6 números entre as 60 possibilidades e a partir dai, extrapolamos para os jogos com mais dezenas.</p>



<p>Para calcular as combinações, dentro da matemática probabilística, utilizamos uma fórmula de combinação simples (análise combinatória):</p>



<figure class="wp-block-image aligncenter size-large is-resized"><img loading="lazy" decoding="async" src="https://alexandrepolselli.com.br/wp-content/uploads/2023/03/image.png" alt="" class="wp-image-1269" style="width:158px;height:50px" width="158" height="50"/></figure>



<p>Para realizar o cálculo de probabilidade de um jogo simples, temos então:</p>



<figure class="wp-block-image aligncenter size-large is-resized"><img loading="lazy" decoding="async" src="https://alexandrepolselli.com.br/wp-content/uploads/2023/03/image-2.png" alt="" class="wp-image-1273" style="width:170px;height:59px" width="170" height="59"/></figure>



<p>O resultado é <strong>50.063.860</strong>, isso significa que existem <strong>50.063.860</strong> de possibilidades de se fazer um jogo com 6 números num volante de 60 números, ou seja, ao fazer um jogo simples, você tem 1 chance de vitória em <strong>50.063.860</strong>, o que dá <strong>0,000002%</strong> de probabilidade de vitória.</p>



<p>Mas isso é para um jogo simples, e como calculamos a probabilidade para as demais variáveis do jogo?</p>



<p>Dentro da categoria da sena, se formos realizar um jogo com 7 dezenas por exemplo, que é o próximo nível, se conseguirmos calcular quantas vezes maior é a probabilidade de vitória, basta dividirmos a probabilidade total do jogo simples por essa grandeza.</p>



<p>Calculamos então a combinação de 7 em 6 ou seja, quantas combinações de 6 números podem ser feitas com 7 números e temos <strong>C 7,6 = 7,</strong> onde a probabilidade de vitória de um jogo com 7 dezenas é 7 vezes maior do que um simples jogo com 6 dezenas.</p>



<figure class="wp-block-image aligncenter size-large is-resized"><img loading="lazy" decoding="async" src="https://alexandrepolselli.com.br/wp-content/uploads/2023/03/image-4.png" alt="" class="wp-image-1275" style="width:191px;height:58px" width="191" height="58"/></figure>



<p>Já para calcular a probabilidade de se ganhar na quina ou na quadra, como nós precisamos de menos números para ganhar, significa que temos um saldo positivo de probabilidades dentro de cada categoria com a mesma dezena que fazemos o jogo da sena, então é mais fácil de se obter a vitória probabilisticamente (o prêmio em dinheiro também é menor).</p>



<p>Nesse caso temos para um jogo de 7 dezenas na quina a seguinte fórmula:</p>



<figure class="wp-block-image aligncenter size-large is-resized"><img loading="lazy" decoding="async" src="https://alexandrepolselli.com.br/wp-content/uploads/2023/03/image-6.png" alt="" class="wp-image-1279" style="width:487px;height:61px" width="487" height="61"/></figure>



<p><strong>(C 7,5 = 21) x (C (60-7), 1 =  53) = 1.113, em seguida 50.063.860/1.113</strong> resultando em <strong>44.981 combinações possíveis</strong>, ou seja, <strong>1 chance de vitória em 44.981</strong> ou uma probabilidade de vitória de <strong>0,00222% que é 1.113 maior </strong>do que um jogo simples da sena<strong>.</strong></p>



<p>A partir dessa fórmula, como resultado final, calculando a probabilidade de vencer cada categoria (sena, quina e quadra) para todas as faixas de dezenas, temos a seguinte tabela, onde:</p>



<ul class="wp-block-list">
<li>Margem de grandeza: quantas vezes a probabilidade de vencer é maior do que um jogo simples da sena</li>



<li>Probabilidade: Qual é a probabilidade de vencer, realizando um jogo com a quantidade de dezenas e categoria determinada (em porcentagem)</li>



<li>Chances de ganhar: Qual é o número de combinações possíveis de se fazer realizando um jogo com a quantidade de dezenas e categoria determinada.</li>
</ul>



<figure class="wp-block-image size-large"><img decoding="async" src="https://alexandrepolselli.com.br/wp-content/uploads/2023/03/image-1-1024x348.png" alt="" class="wp-image-1272"/></figure>



<p>É interessante observar algumas coisas como o poder probabilístico de um jogo com 20 dezenas, que apesar se possui apenas 16 números a mais, aumenta suas chances de vitória em 38.760 vezes de ganhar a sena e reduz as possibilidades de combinações da quadra em apenas 13! É sem dúvidas o jogo mais poderoso.</p>



<p>Abaixo é possível observar como cada número de dezena adicional aumenta progressivamente a probabilidade de vitória.</p>



<figure class="wp-block-image aligncenter size-large"><img decoding="async" src="https://alexandrepolselli.com.br/wp-content/uploads/2023/03/image-14.png" alt="" class="wp-image-1293"/></figure>



<h2 class="wp-block-heading">Vale mais a pena financeiramente fazer apostas com mais dezenas?</h2>



<p>Quando se vai fazer um jogo, você escolhe quantas dezenas quer apostar. Ao escolher o menor número possível que é 6, conhecido como jogo simples, o preço do bilhete na lotérica é de R$4,50.</p>



<p>Ao tentar fazer um jogo com mais dezenas, o preço é mais caro e o motivo desse valor mais caro, é que ele segue uma ordem de grandeza proporcional à sua probabilidade de vitória como é possível perceber abaixo:</p>



<figure class="wp-block-image aligncenter size-large"><img decoding="async" src="https://alexandrepolselli.com.br/wp-content/uploads/2023/03/image-7.png" alt="" class="wp-image-1281"/></figure>



<p>Um jogo com 7 dezenas te dá 7 vezes mais chances de vitória do que um jogo de 6, assim como um jogo de 8 dezenas te dá 28 vezes mais chances de vitória do que um de 6 e assim vai&#8230;</p>



<p>É interessante observar que antes de 2022 só era possível apostar até 15 dezenas e o jogo foi atualizado, <a href="https://bnldata.com.br/ministerio-da-economia-autoriza-apostas-multiplas-na-mega-sena-de-ate-20-dezenas/" target="_blank" rel="noreferrer noopener">saindo uma notificação no diário oficial aumentando o teto para 20 dezenas.</a></p>



<p>em meio a tantos números pode surgir a dúvida sobre o que é mais vantajoso estatisticamente falando, fazer diversos jogos simples ou investir direto em um jogo mais caro? Existe real vantagem financeiramente?</p>



<p>Como é possível observar na tabela, o preço de cada aposta é exatamente o valor de um bilhete simples multiplicado pela grandeza de probabilidades, nesse sentido, uma aposta com 10 dezenas, aumenta 210 vezes a sua probabilidade de vitória e portanto é 210 vezes mais caro do que um bilhete simples.</p>



<p class="has-text-align-center"><strong>210 x R$4,50 = R$945,00</strong></p>



<p>A resposta então é que <strong>não é mais vantajoso financeiramente fazer jogos com mais dezenas</strong>, pois estatisticamente o resultado é o mesmo, ou seja, pagar R$945,00 para fazer uma aposta com 10 dezenas garante a mesma probabilidade estatística de vitória do que fazer 210 apostas pagando R$4,50.</p>



<h2 class="wp-block-heading">Quanto dinheiro é necessário investir para se obter 100% de chances de vitória e qual é o retorno sobre o investimento (ROI)?</h2>



<p>É claro que na prática comprar todos os bilhetes para obter esse resultado seria impossível, não por questões financeiras, mas pelo simples fato de que não é possível impedir que as pessoas também comprem outros bilhetes (e provavelmente não é permitido pela regulamentação também), mas aqui iremos <strong>trabalhar no campo teórico. </strong></p>



<p>Sabendo o preço de um bilhete de jogo básico e sua probabilidade de vitória, basta fazer uma regra de 3 onde: </p>



<figure class="wp-block-image aligncenter size-large"><img decoding="async" src="https://alexandrepolselli.com.br/wp-content/uploads/2023/03/image-9.png" alt="" class="wp-image-1283"/></figure>



<figure class="wp-block-image aligncenter size-large"><img decoding="async" src="https://alexandrepolselli.com.br/wp-content/uploads/2023/03/image-8.png" alt="" class="wp-image-1282"/></figure>



<p>Na segunda tabela é possível obter uma validação onde 100% de probabilidade de vitória batem com o número total de combinações de um jogo simples.</p>



<p>A resposta é que seria necessário investir em média R$ 225.287.370,00 para se obter 100% de chances de vitória.</p>



<p><strong>Esse investimento valeria a pena?</strong></p>



<p>Observando uma tabela com os 10 maiores prêmios acumulados da mega-sena,  é possível verificar que os valores são sempre superiores a R$ 225.287.370,00, nesses casos haveria um roi positivo em todos os casos.</p>



<figure class="wp-block-image aligncenter size-large"><img decoding="async" src="https://alexandrepolselli.com.br/wp-content/uploads/2023/03/image-10.png" alt="" class="wp-image-1284"/></figure>



<p>Porém essa não é a realidade para todos os concursos. Em caso de prêmios individuais por exemplo, conseguimos ver uma queda nítida e repentina nos valores das premiações e a partir da segunda premiação, já seria um prejuízo constatado.</p>



<figure class="wp-block-image aligncenter size-large"><img decoding="async" src="https://alexandrepolselli.com.br/wp-content/uploads/2023/03/image-12.png" alt="" class="wp-image-1286"/></figure>



<h2 class="wp-block-heading">Referências:</h2>



<ul class="wp-block-list">
<li><a href="https://loterias.caixa.gov.br/Paginas/Mega-Sena.aspx" target="_blank" rel="noreferrer noopener nofollow">https://loterias.caixa.gov.br/Paginas/Mega-Sena.aspx</a></li>



<li><a href="https://www.sorteonline.com.br/mega-sena/como-jogar" target="_blank" rel="noreferrer noopener nofollow">https://www.sorteonline.com.br/mega-sena/como-jogar</a></li>



<li><a href="https://pt.wikipedia.org/wiki/Combinat%C3%B3ria" target="_blank" rel="noreferrer noopener nofollow">https://pt.wikipedia.org/wiki/Combinat%C3%B3ria</a></li>



<li><a href="https://redeloteria.com.br/mega-sena/todos-os-resultados-da-mega-sena/29275" target="_blank" rel="noreferrer noopener">https://redeloteria.com.br/mega-sena/todos-os-resultados-da-mega-sena/29275</a></li>



<li><a href="https://www.lottoland.com/br/revista/os-ganhadores-e-maiores-premios-da-megasena.html" target="_blank" rel="noreferrer noopener">https://www.lottoland.com/br/revista/os-ganhadores-e-maiores-premios-da-megasena.html</a></li>
</ul>
<p>O post <a href="https://datauniverse.com.br/mega-sena-um-estudo-sobre-probabilidades-e-combinacoes/">Mega-Sena: Um estudo sobre probabilidades e combinações</a> apareceu primeiro em <a href="https://datauniverse.com.br">Data Universe</a>.</p>
]]></content:encoded>
					
					<wfw:commentRss>https://datauniverse.com.br/mega-sena-um-estudo-sobre-probabilidades-e-combinacoes/feed/</wfw:commentRss>
			<slash:comments>0</slash:comments>
		
		
			</item>
	</channel>
</rss>
