로또(1,069회), 확률에 비해 많이 당첨된 회차는?

로또 등위별 이론상의 당첨자 수에 대한 실제 당첨자 수의 오차율을 산출하여 그 의미에 대하여 논한다. 로또 경우의 수를 언급한다. 오차율 산출 결과 파일과 지난 모든 회차의 당첨 번호, 등위별 당첨자 수, 당첨 금액을 담은 파일을 함께 제공한다. 실제 당첨자 수가 이론상의 당첨자 수와 크게 차이가 날 때는 사람들의 번호 선택이 무작위적이지 않았다는 의미가 되므로 이 자료의 의미를 잘 분석해 본다면 사람들의 번호 선호도를 추측할 수 있다. 사람들이 많이 선택하는 번호가 당첨 번호로 뽑히면 1~3등 당첨금이 작아지므로 당첨금 기댓값을 높이기를 바라는 사람은 사람들이 덜 선택하는 번호가 어떤 것인지를 연구해 볼 필요가 있다.

* 이후 이 주제에 관하여 매주 갱신되는 최신 자료는 아래의 글에서 볼 수 있습니다. 자료 이외에도 서로 다른 내용이 있을 수 있습니다:
https://hhtt.kr/78

로또 카테고리에 로또에 관한 여러 통계와 분석을 앞으로도 꾸준히 올릴 예정이니 계속 방문해 주세요. 🙂
(매주 최소 1건은 올리도록 노력하겠습니다.)
https://hhtt.kr/category/lotto

당첨자 수 오차율

로또 등위별 당첨자 수 오차율을 다음과 같이 정의합니다.

등위별 당첨자 수 오차율 = ((실제 당첨자 수) -(이론상의 당첨자 수)) / (이론상의 당첨자 수)

이 값이 양수이면 당첨자 수가 이론보다 많이 나왔다는 의미이고, 음수이면 그 반대입니다.

실제 당첨자 수는 복권 수탁사업자가 매주 발표하는 자료를 참고하면 얻을 수 있고, 이론상의 당첨자 수를 먼저 계산해 보겠습니다.
대한민국에서 시행되고 있는 6/45 로또 복권의 총 경우의 수와 등위별 경우의 수는 다음과 같습니다.

총 경우의 수1등 경우의 수2등 경우의 수3등 경우의 수4등 경우의 수5등 경우의 수
8,145,0601622811,115182,780

동행복권이 발표한 지난 1,069회 총판매금액을 1000으로 나누면 108,388,892 라는 숫자가 나오는데 판매된 로또 복권 숫자입니다. 다른 방법으로는 동행복권이 배포하는 스프레드시트에 나오는 등위별 당첨자 수와 당첨금으로부터 등위별 총당첨금을 합산하여 총당첨금액을 구한 후에 두 배로 곱하면 총판매금액이 나옵니다. 이걸 1000으로 나누니까 108,388,894라는 숫자가 나옵니다. 두 숫자 사이에 2라는 차이가 발생했습니다. 그 이유는 이렇게 추측합니다. 1~3등 당첨금을 산정할 때 1원 단위로 반올림할 것이므로 거기에서 오차가 끼어들 수 있습니다. 저는 다른 회차에 관해서도 스프레드시트의 자료를 바탕으로 계산할 것이므로 비록 1억분의 2라는 오차가 있지만 일관성을 유지하기 위해서 108,388,894 라는 숫자를 사용하겠습니다.

108,388,894 / 8,145,060 = 13.3

 

따라서, 지난 1,069회의 등위별 이론상의 당첨자 수는 다음과 같습니다.

1등2등3등4등5등
13.379.83,034147,9112,432,311

동행복권에서 발표한 실제 당첨자 수는 다음과 같습니다.

1등2등3등4등5등
14793,006146,3352,419,527

등위별 오차율은 다음과 같습니다.

당첨자 수 오차율
1등2등3등4등5등
0.0521-0.0106-0.0093-0.0107-0.0053

1등 당첨자 수 오차율이 제일 큰데 당첨자 수 차이는 겨우 14 – 13.4 = 0.6입니다. 적어도 1등에는 5% 오차율도 큰 의미는 없는 것 같습니다. 지난 1,069회는 이론과 실제가 비교적 비슷했다고 생각합니다. 1,069회는 저한테는 별 재미없는 회차라고 할 수 있겠습니다. 아래의 표에 나와 있지만 다른 회차의 결과는 이렇게 밋밋하지 않습니다.

당첨자 수 오차율 산출 결과 및 그 의미

지난 몇 회차의 당첨자 수 오차율을 아래 표에 실었습니다 (모든 회차의 결과는 첨부 파일에 넣었습니다).

회차1등2등3등4등5등
10690.052-0.011-0.009-0.011-0.005
10680.4200.0840.0210.0140.014
1067-0.0440.0060.1870.0820.034
10660.1480.1220.1150.0520.018
10650.054-0.0710.0290.006-0.005
10640.414-0.2310.0760.0630.028
1063-0.474-0.311-0.108-0.056-0.012
1062-0.468-0.138-0.110-0.086-0.052
1061-0.1850.223-0.024-0.028-0.017
10601.0610.1770.4830.1880.033
1059-0.0450.0160.0080.0040.012
1058-0.055-0.273-0.020-0.0030.012
10570.2317.011-0.060-0.046-0.025
10560.007-0.0290.016-0.023-0.030
1055-0.2040.1100.0840.0790.055
1054-0.355-0.212-0.147-0.095-0.056
1053-0.499-0.236-0.151-0.118-0.072
1052-0.1670.363-0.0280.009-0.003
10510.230-0.203-0.154-0.119-0.074
10500.281-0.121-0.053-0.019-0.010

몇 회차를 골라서 재미있는 점을 지적하여 표를 보는 방법을 설명하겠습니다 (이하, 당첨자 수 오차율 = 오차율).
1,068회는 모든 등위의 오차율이 양수로 나왔고, 특히 1등 오차율이 42%로 아주 크게 나왔습니다. 이 회차의 당첨 번호들은 사람들이 비교적 많이 선택한 것 같습니다.
1,063회는 모든 등위의 오차율이 음수로 나왔고, 특히 1, 2등이 각각 -47%, -31%로 크게 나왔습니다.

오차율의 크고 작음은 절댓값에 관해서 언급한 것으로 하겠습니다.

이 회차의 당첨 번호들은 사람들이 비교적 적게 선택한 것 같습니다.
1,062회는 1,063회와 비슷한데 2등 오차는 1등에 비해 조금 낮습니다.  이 회차의 당첨 번호들은 사람들이 비교적 많이 선택한 것 같습니다.
1,061회는 2등 오차율만 양수로 크게 나오고 다른 등위 오차율은 모두 음수입니다. 이 회차의 보너스 번호는 사람들이 많이 선택했다고 볼 수 있습니다.

어떤 회차는 오차율이 등위별로 뒤죽박죽인 경우도 있습니다.

양이 많아서 오늘 다 하기는 힘듭니다. 계속 연구해 보도록 하겠습니다. 여러분도 파일을 들여다보면서 그 오차율의 의미를 궁리해 보면 썩 재미있을 것입니다.

첨부 파일

이 파일은 지난 모든 회차의 등위별 당첨자 수 오차율을 담은 파일입니다:
lotto-kr-0001-1069-winner-number-error-rate.ods

이 파일은 동행복권에서 내려받은 파일을 이름만 바꾼 것으로, 지난 모든 회차의 당첨 번호, 등위별 당첨자 수, 당첨 금액을 담고 있습니다:
excel-lotto-kr-1-1069.xls

 

Leave a Comment