1070회까지의 로또 등위별 이론상의 당첨자 수에 대한 실제 당첨자 수의 오차율을 산출하여 그 의미에 대하여 논한다. 로또 경우의 수를 언급한다. 오차율 산출 결과를 텍스트 파일로 제공한다. 로또는 눈치싸움이다. 다른 사람들이 어떤 선택을 했는지를 알고, 앞으로 어떤 선택을 할지를 대략이라도 아는 사람은 자신만의 무기를 가진 셈이다. 특정 회차 특정 등위에서 오차율의 절댓값이 특이하게 크다면 이는 사람들의 번호 선택이 무작위적이지 않았다는 것을 의미한다. 따라서 이 자료의 의미를 잘 분석해 본다면 사람들의 번호 선호도를 추측할 수 있다. 사람들이 덜 선택하는 번호를 선택해야 당첨금 기댓값이 높아진다. 오늘은 특히 2등 당첨자 수 오차율의 의미를 분석해 본다. 2등 당첨 조합에 대한 보너스 번호의 기여는 큰 편이므로 2등 당첨자 수 오차율은 보너스 번호로 출현한 번호에 대한 사람들의 선호도와 많이 관련되어 있다.
* 이후 이 주제에 관하여 매주 갱신되는 최신 자료는 아래의 글에서 볼 수 있습니다. 자료 이외에도 서로 다른 내용이 있을 수 있습니다:
https://hhtt.kr/78
로또 카테고리에 로또에 관한 여러 통계와 분석을 앞으로도 꾸준히 올릴 예정이니 계속 방문해 주세요. 🙂
(매주 최소 1건은 올리도록 노력하겠습니다.)
https://hhtt.kr/category/lotto
Contents
당첨자 수 오차율
로또 등위별 당첨자 수 오차율을 다음과 같이 정의합니다.
등위별 당첨자 수 오차율 = ((실제 당첨자 수) -(이론상의 당첨자 수)) / (이론상의 당첨자 수)
이 값이 양수이면 당첨자 수가 이론보다 많이 나왔다는 의미이고, 음수이면 그 반대입니다.
더 자세한 이론적인 설명은 다음 글을 참고하십시오 (아래에서 지난 글이라고 하는 글은 이 글입니다):
https://hhtt.kr/32
유의미한 오차율
지난 1070회의 당첨 번호, 보너스 번호와 당첨자 수 오차율 산출 결과는 다음과 같습니다.
당첨번호 | 보너스 | |||||
03 | 06 | 14 | 22 | 30 | 41 | 36 |
당첨자 수 오차율 | ||||
1등 | 2등 | 3등 | 4등 | 5등 |
0.063 | -0.202 | -0.021 | -0.024 | -0.022 |
1등 당첨자 수 오차율은 보다시피 6.3%가 나왔습니다. 실제 내용을 보겠습니다. 1070회의 로또 복권 판매량은 로또 경우의 수인 8,145,060의 13.2배였으므로 이론상의 1등 당첨자 수 = 13.2 명입니다. 그런데 동행복권에서 발표한 1등 실제 당첨자 수는 14입니다. 그래서 오차율이 6.3%였다는 것입니다. 이 정도면 용인할 수 없는 오차율입니까? 1등에 0.8명 더 당첨됐다고
당첨 번호 유출됐다!
이럴 사람은 없을 거로 생각합니다. 저는 1등에 한 2명 더 당첨되어도
뭐, 1등에 한 2명 더 당첨될 수도 있는 거 아닌가?
이럴 거 같은데 여러분은 어떻습니까? 1등에 이론치보다 2명 더 당첨됐다고 가정하고 1등 당첨자 수 오차율을 계산해 보면 2/13.2 = 0.1515… 즉 약 15% 오차율입니다. 그럼, 위에서 한 제 말은 다음의 말과 똑같습니다.
로또 1등 당첨자 수 오차율이 15%라도 용인할 수 있는 수준이다.
1등 당첨자 수에서 2명이라는 오차가 생겼다는 것은 제가 임의로 생각해 낸 수치인데 계산해 보니 15%라는 적지 않은 오차율에 해당하는 것이었습니다.
1등 당첨자 수 오차율을 15%까지는 별거 아닌 걸로 하기로 했으면 다른 등위에도 같은 기준을 적용해야 하겠네?
15% 오차율을 문제 삼지 않겠다고 하면 통계전문가들이나 특정 전문가들이 펄쩍 뛰겠습니다만, 유의미한 오차율을 선별하기 위한 안전한 기준이라고 생각하고 적어도 오늘은 그런 기준을 적용하겠습니다.
1070회 당첨자 수 오차율 산출 결과 및 그 의미
지난 1070회의 당첨자 수 오차율을 계속 살펴보겠습니다. 당첨자 수 오차율의 절댓값이 15% 이하이면 무의미하므로 용인한다고 가정하면, 1070회의 1등, 3등, 4등, 5등 당첨자 수 오차율은 용인할 수 있는 수준입니다. 그러나 2등 당첨자 수 오차율은 -20%이므로 유의미하며 용인할 수 없는 수준이라고 볼 수 있습니다. 용인할 수 없는 수준이라는 것은 무작위적인 번호/조합 선택에서는 나올 수 없는 오차율 수치라는 의미입니다. 사람들이 자동 조합으로만 로또 복권을 구매한다면 -20%의 당첨자 수 오차율은 나올 수 없다고 생각합니다. 따라서, 사람들이 특정 조합에 몰린다는 간접적인 증거라고 볼 수 있습니다.
보너스 번호의 2등 조합에 대한 기여도는 큰 편이다.
어떤 조합이 2등에 당첨되기 위해서는 반드시 보너스 번호가 포함되어 있어야 하고 1등 당첨 번호는 6개 중 5개만 있으면 됩니다. 단순 산술적으로 계산할 때, 보너스 번호의 기여도는 1/6 이고 1등 당첨 번호 6개의 총기여도는 5/6 입니다. 따라서, 1등 당첨 번호 6개 각각의 기여도는 (5/6)*(1/6)=5/36 입니다. 즉, 보너스 번호의 기여도 1/6(=6/36)은 1등 당첨 번호 각각보다 1/36만큼 더 크다는 결론이 나옵니다.
1070회에서는 2등 당첨자 수가 이론치보다 20%나 적게 나왔으므로 다음과 같이 추측할 수 있습니다
1070회에서 사람들은 36을 보통보다 덜 선택했을 가능성이 있다.
결과적으로 36이 보너스 번호로 출현하여 2등 당첨자 수를 적게 만들었다고 볼 수 있습니다. 그럼, 다른 회차에서도 사람들이 36을 덜 선택했나 싶어서 확인해 보니 아쉽게도 꼭 그렇지만은 않았습니다. 사람들의 번호 선택은 매번 달라집니다. 그러나, 항상 이런 의문을 품고 있습니다:
사람들이 모든 번호를 고르게 선택할까?
기획재정부 복권위원회는 다 알고 있겠지만 모든 정보를 다 공개하지는 않을 것 같습니다. 지난 1,019회에서 1등이 50명이나 나와서 문제가 될 것 같으니까, 사람들의 번호 선택 행태를 일부 공개했는데 그런 정보를 너무 자세히 공개하면 경기가 좀 재미없어지는 의미가 있습니다. 그러니 현재로서는 추측해 볼 수밖에 없습니다. 통계적으로 더 조사해 보면 번호 선택 선호도에 관한 어떤 유의미한 결과가 나올 수 있다고 생각합니다.
역대 당첨자 수 오차율 산출 결과 및 그 의미
이 주제에 관한 지난 글에서도 언급했습니다만 첨부 파일에 들어있는 역대 회차의 등위별 당첨자 수 오차율을 들여다보면 아주 재미있습니다. 그중에서 몇몇은 지난 글에서 다루었으니 궁금한 분은 참고하십시오.
오차율의 절댓값이 너무 크게 나온 예는 사람들의 특이한 선택의 결과일 가능성이 크다.
오차율의 절댓값이 너무 크다는 기준은 다른 회차의 같은 등위보다 클 때를 가리킨다고 생각하면 무난하겠습니다. 아무튼 오차율이 튀는 예를 골라서 그 의미를 곰곰이 생각해 보시기 바랍니다.
첨부 파일 (텍스트 파일)
이 파일은 1070회까지의 모든 당첨 번호, 보너스 번호, 등위별 당첨자 수 오차율을 담은 텍스트 파일입니다:
첨부 파일을 2개 준비했습니다(텍스트 파일). 문자 인코딩만 다르고 내용은 같습니다. 파일의 시작 부분은 다음 스크린샷과 같습니다.
안드로이드, 아이폰, 리눅스, 맥 사용자:
lotto-kr-unix-0001-1070-winner-number-error-rate-1.txt