이건 김어준의 더플랜이란 음모론 영상에 대한 견해다. K=1.5에 대한 대체 가설 궁금하면 바로 넘어가시라. 물론 오류지적엔 마음이 열려있습니다. 댓글 달아주세요 (이메일이 이상하거나 욕설 등은 허가 안 해드립니다).
update update update: 중앙선관위의 공식적인 답변이 나왔는데, 읽으며 수긍갑니다. 결국 더플랜을 비판한 많은 분들과 비슷하고, K값에 대해선 연령별 기표실수차 효과로 설명하네요. 모두 공개검증 용의도 있다고 합니다. 기사: http://www.huffingtonpost.kr/2017/04/19/story_n_16094442.html#cb 한글HWP 읽기 싫으신 분은 이 링크로 읽어보세요. 아주 정리 잘 되어 있습니다: https://issuu.com/nyangs/docs/__________170419_____18____________
Update update: 특별히 K값에 대한 제 대체가설은 많은 분들의 피드백과 새로이 접한 사실들을 비탕으로 볼 때 의미있는 가설로 보기 어렵다고 판단하게 됐습니다. 이에 대해 궁금하신 분들은 http://ravenclaw1969.blogspot.kr/2017/04/blog-post_16.html 글을 일리있게 읽었으니 추천드립니다. 맘이 앞서 혼란 끼친 것 심히 죄송하게 생각하고, 피드백 주신 것들 감사합니다. 근신하겠습니다.
update: 제가 생업이 바쁘기도 하고 댓글들에 바로 응대할 수 없을 것 같습니다. 그리고 無異 님께서 연령효과에 의해서도 K값이 달라지는 또다른 대체가설을 제시해주셨는데 일리 있어 보입니다. (특히 미분류표의 대부분이 유/무효가 갈리는게 아니라 인주가 번진 표일 것 같은 영상도 접했습니다. 만약 이게 일반적인 패턴이라면 무효표룰 변화가 얼마나 큰 영향을 끼쳤을지 재고할 부분이 있다고 생각합니다) 참고부탁드립니다.
0.5 형식 (넘어가셔도 됩니다)
내가 이 영상에서 싫어하는 것은 (1) 형식과 (2) 추론이다. 잠깐 형식을 먼저 얘기하자.
개연성을 높이기 위해서 관련이 없는 얘기들을 잔뜩 늘어놓고, 변죽을 잔뜩 울려서 정신이 없는 와중에 아주 약한 인과관계의 연쇄를 갑자기 진행시킨다. 그 끝에 아주 큰 주장을 하고 있으면서, 그게 큰 주장이 아니라 상식적이라고 주장한다. 그리고 그럴듯하게 전문가들을 소모해서 전문적인 내용들을 마치 이해하게 한 양 치장하고, 간단한 문제를 말도 안 되게 복잡하게 설명하는 것들도 포함한다.
한 마디로 음모론의 전형적 형식으로 영상을 구성했다는 것이다. 다단계나 노인들 약팔이에 쓰는 기법들, 간단히 야바위질이라고 할 수 있다.
내가 얼마나 똑똑한데 어떻게 속을 수 있어? 라고 하면, 사람이 원래 이런 인지편향에 약하다. 나도 마찬가지로 어렸을적부터 종종 음모론 이야기에 빠졌다 (내 세대에는 “신의 지문”이라든지, “비류백제”란 책들 읽어보신 적이 있나 모르겠다). 그냥 사람의 약점을 공략하는거다. 나는 이런 형식을 김어준이 모르고 했다고 생각하지 않는다. 아주 잘 알고 활용하는 솜씨다. 일전에 황우석사태 등에서도 잘 보여준 바 있다.
예를 들어 시종일관 외국사례들을 갖다가 놓는데, 여기서 거의 의도적이라고 할만큼 전자투표기와 전자개표기를 섞어 쓰고 있다. 더해 한국에선 전자개표기 이후에 수개표가 이뤄진다는 것을 축소한다. 영상의 클라이맥스라고 할 개표 “시연”은, 개표과정이 개표기로 끝난다는 식으로 검표과정을 생략한다. 개표기를 고장내서 (해킹해서 분류를 삐꾸같이 하게 만든거다) 당연히 득표수가 잘못되면, 그걸 전국적으로 발견하지 않고 당락을 뒤바뀌는 백만표를 고칠 수 있다는건 얘기는 안 하지만 자연스럽게 그렇게 호도한다.
전문가들을 소모하는 것도 그렇다. 미국의 학자들이 한국의 투표시스템에 대해서 알겠는가? 미국 투표용지랑 한국 기표방식이 얼마나 다른지나 알고서 “3% 미분류는 말이 안 된다”란 말에 전문가적인 판단이 들어가있다고 할 수 있겠는가? 그냥 자기가 필요한 꼭지를, 잘 모르지만 credential은 있어 보이는 사람들 따다가 붙이는 저열한 방법이다. 그래서 전문가들이 뭔가 이상한 것 같은데 검증하자, 이러면서 말 보태기 시작하면, 그게 김어준 et al.이 원하는 분위기 연출에 조력하고 소모되는 것이다.
그리고 가장 명확하게 해야할 이른바 시연 부분에서 검표같은 부분은 쏙 빼고, 감성팔이로 넘어가고 있다.
마지막으로 상식적으로 반론을 할만한 진짜 한국 개표상황을 잘 아는 사람들의 반론은 앞에 배치한다. 당연히 추론을 전개할 때 이런 사람들은 요소요소에, 또는 최대한 뒤에 배치하는 것이 정직하다.
1. 작은 의혹들 (넘어가셔도 됩니다)
작은 의혹들부터 처내자.
김어준이 하는 의혹제기 중에 시간역순이란 얘기는 http://ravenclaw1969.blogspot.kr/2017/04/blog-post.html 이 글을 발췌하는 것으로 족하다:
그리고 어떻게 시간을 앞서서 보도하느냐는 이야기는 현장에 있는 기자들을 어미가 물어다주는 먹이만 먹는 뻐꾸기 새끼 정도로 취급하는거죠. 자기네들이 나가 있는 선거구에서 누가 얼마를 득표했는지 다른 방송사보다 빠르게 전달하기 때문에 현장에 나가 있는 기자들이 직접 카운트 합니다. 선관위 결과보다 항상 언론보도가 빠를 수 있는 이유가 뭐겠어요? 선관위에서 개표발표를 한 다음에 방송 내보내는 방송사 본 적 없습니다.
역누적이란 얘기는, 그냥 도농 사이에 지지후보가 갈리고, 도시 선거구가 뒤늦게 개표완료되기때문에 그렇게 보이는거다. “문재인이 유리한 투표함이 나중에 열렸다”라니. 서울, 인천 등 전국 광역자치단체 전부에서 그랬다고 하는데 당빠 다 그렇게 나온다. 왜냐면 모든 광역자치단체엔 도시랑 촌 지역이 다 있다. 차라리 각급 개표소나 투표소별로 말하면 더 신빙성이 있었을거다.
2. 개표기
자, 전개를 명확하게 하자.
여기서 최종적으로 주장하는 것은 간단하다.
전자개표기가, 표를 100장씩 묶을 때 잘못된 혼입을 의도적으로 일으켜서, 자기가 원하는 선거결과를 만들게 하는데 조작될 수 있다는 것이다. (그게 “시연”을 통해 보여준거다. 웃긴게 거기서도 자원자들이 실제 혼입이 일어나는 것을 목격하는 장면들이 종종 나온다. 사람도 확인할 수 있단 얘기다)
(그리고 말은 안 하지만 계속 정황을 대면서 말하는게, 그게 실제로 일어났고, 그래서 박근혜대통령은 개표조작을 통해 당선된 가짜란 것일테다.)
이 주장에 이르기 위해 어떤 논리전개를 하는지 보자.
(1) 전자개표기의 미분류율 3%는 너무 높다.
(2) 18대 대선에서 보니 미분류되었다가 돌아온(?) 표의 각 후보별 비율과 분류된 표의 후보별 비율을 보면 일관되게 박근혜가 미분류표에서 1.5배 더 높다.
(3) 16, 17대 sample에 따르면 저런 편이는 관찰되지 않는다.
(4) 따라서 18대때 기계가 이상한거다.
(5) 기계가 이상하게 행동한건 확실하고, 이게 일관되게 1.5란 수치로 정규분포를 그리고 있기때문에 프로그램이든 하드웨어든 조작했다고 볼 수 있다.
(6) 기계를 조작했다면 당연히 혼입하게 만들 수도 있었을 것이다.
(7) 혼입하게 만드니까 맘대로 득표수를 바꿀 수 있다.
(이 논리의 연장선상으로 부정선거로 박근혜대통령 당선 무효란 얘기는 다음 섹션에서 다루겠다.)
여기서 제일 먼저 하나를 지적하자. (6)은 소설이다. 실제로 수치상에 그런 일이 발생했다는 아무런 근거도 제시하지 않았다. 문제는 (5)의 “1.5”란 수치가 너무 뭔가 부자연스러워서 누군가 조작했다는 느낌을 주는 것일 것이다. 김어준은 정규분포라는게 중요하다고 했다는데 (파파이스 뒷부분은 안 봄) 고등학교때 아직도 배우는지 모르는데 중심극한정리를 알려주면 될 것이다.
또 소소한 것 하나, (1)의 미분류율 3%는 너무 높다는 건 시종일관 외국 사람들에게 물어본거다. 미국 기표방식도 천양지차지만, 한국의 18대 대선처럼 기표하는 방식은 없다고 알고 있다. 대부분 사지선다나 오지선다 수능 찍듯이 동그라미를 칠하는 방식이 주여서, 한국처럼 따닥따닥 붙어있는 기표란에다가 기표하는 방식이 아니다. 당연히 기계가 미분류해서 사람에게 확인을 요구하는 방식 대한 이해가 떨어질 수밖에 없다.
(4)에 대해서는, 대체 가설들이 가능하다고 생각한다. 아래부터는 이와 관련된 내용이다.
이 미분류표에 대해서 언어장난질을 하고 있다. “미분류되었다가 돌아온 표”라고 하면 마치 정상적인 박근혜나 문재인을 찍은 표가 기계가 잘못 분류를 못했다고 생각하게 만드는 것이다. 당연히 미분류표는 미분류될 여지가 있으니까 미분류된거다. 그리고 미분류된건 사람들이 룰에 따라 박근혜나 문재인표로 올리는 것이다.
그럼 미분류표는 어떻게 생겼고 어떤 룰에 따라 유효표냐, 무효표냐를 판정하나?
이런 표들일 것이다. (Update: 여기서 결정적으로 미분류표가 대부분 인주가 번진 것이라는 영상을 알려주셨습니다. 따라서 아래 설명은 의미가 별로 없습니다. 혼란 끼쳐드려서 죄송합니다.)
http://www.wikitree.co.kr/main/news_view.php?id=99167
자, 여기서 주목하셔야할 것이 첫번째 이미지 (유효표 예시) 5-(2)랑, 두번째 이미지 (무효표 예시) 3-(1)이다. 기표를 접선하여 첫번째 줄에 쓰면 그건 유효표로 1번 후보에게 득표가 된다. 그러니까 무조건 걸쳐있기만해도 된다는 것이다. 아마 공직선거법인가 어느 조항에 있을텐데 (알려주시면 수정하겠음), 유권자의 의도를 추론할 수 있는 애매한 표는 표로 계산된다는 룰로 이런 미분류표를 유효표로 분류했다.
위에서 대충 그린 다이어그램은 이럴 때 문제상황을 보여준다. 박근혜의 문제표는 1,2,3에 찍혀있는 경우 유효표로 기록될 것이다. 유권자의 의도가 보이는거니까. 그런데 문재인의 표는 5,6의 경우에만 유효표로 기록되기 쉬울 것이다.
만약 유권자들이 기표를 할 때 랜덤하게 기표를 실수한다고 하자. 그러면 자기가 의도한 정사각형 공간 중에 4변에 찍히는 경우는 같은 확률일 것이라고 추정할 수 있다(물론! 아주아주 단순화한 설명이다! 현실은 더 복잡할 것이지만 이해를 위해서 단순화한 것임). 그러면 박근혜가 유효가 될 확률과 문재인이 유효가 될 확률은 3:2, 즉 1.5배가 되는 것이다. 여기에는 아무런 조작이 없었다. 그냥 룰대로 이상한 표들을 분류하는데 1번이 프리미엄이 있는거다. [1]
(update: 이가 헷갈리는 분증 때메 다른 다이어그램 첨부요)
이게 무슨 복잡하게 개표기를 어쩌구저쩌구하는 것보다 훨씬 깔끔한 설명일뿐만 아니라, 지난 대선에선 그놈의 K값이 1이었던 이유도 설명한다. 왜냐하면 옛날엔 무효표/유효표 판정기준이 달랐기 때문이다.
앞서 18대 대선땐 무조건 줄에 걸쳐있기만해도 판별한다고 했는데, 아주 옛날엔 그 줄에서 기표의 넓이가 넓은쪽에다가 유효표를 줬다. 따라서 1번보다 여백으로 더 떨어져버린 기표들은 무효가 되었을 것이다. 옛날에 막 자갖고 쟀다고하나, 표차가 매우 박빙이었던 경우 사람들이 갑론을박하고 무효표들 하나하나 법정에 갔단 기사를 옛날에 읽은 기억이 난다.
즉 이런 경우엔 아마도 (이건 추정이고 해보신 분들이 말씀해주시면 될 듯) 저 다이어그램에서 1번에 해당하는 기표에 대해서도, 더 엄격하게 유효표를 가렸을 가능성이 높다. 그렇다면 (3)에서 지지난 대선과 K값이 차이가 난단 것도 설명할 수 있겠다.
백번양보해서 이것도 가설이라고 공격하는 사람이 있을지도 모르겠다. 허나 이런 대체가설에 대해 논의하지 않고 바로 조작 얘기로 슝슝 (4)에서부터 주루룩 넘어간게 아주 나쁘다는거다. 대체 가설은 기계는 죄가 없고 열쒸미 경계선에 찍힌 애들을 미분류에 정직하게 보내고, 그걸 사람들이 판단하는 룰에 1번에 좀 유리한 팩터가 있었다고 볼 수 있는 것이다.
3. 당락이 바뀌겠나?
어쨌든 저건 불합리하다고 얘기할지도 모르겠다. 그런데 저 시나리오에서 그럼 박근혜대통령은 얼마나 더 표를 먹었단건가?
대충 계산하면, 미분류표가 전체 득표수의 3%나 되었다고 했다. 박근혜 총득표수에서 대충 1.5%를 곱하고 여기서 1/3을 깎으면 된다. 그럼 대충 8만여표다. 18대 대선에서 양대후보의 표차가 얼마나 났는지는 잘 아실테니까 넘어가자.
4. 에이, 그래도 찝찝한데 수개표하자.
수개표하던 시절에 선거를 안 해본 사람들이 많아서 그런지 저런 소리 한다. 이러면 개표 자체가 너무 오래 걸리고, 오히려 사람이 오류율이 더 높아서 신뢰도가 떨어진다. 그리고 예전처럼 교사에 은행원들 동원해서 개표하는 것이 과연 가능할까. 투표소에서 직접 수개표하잔 얘기도 개표 감시요원들을 전국 투표소에 다 보낼건가? 또 자기가 원하지 않은 결과 나오면 뭐라할거다.
5. 그럼 이번 대선에도 저렇게 1번 프리미엄이 붙는거에요?
유감스러운지 다행인지 몰라도 아니다. 왜냐하면 당연해 해야하는 일, 이번 총선때부터 이런 무효표 논란을 줄이기 위해 중앙선관위에서 각 후보별 기표란을 띄어버렸기때문이다. 당연히 했어야하는 일이다. 욕할 일이 있다면 그걸 저번에 안 했다는거겠지.
(PS 그런데 지금 그림 보니까 너무 후보들이 많으면 다다닥 붙어서 다시 문제가 생길지도 모르겠다 ㅠ.ㅠ)
진짜 이런거에 빠지지 마시라고 정말 끔찍하게 싫어하는데 대충 한 방에 써서 올립니다. 참고해주세요.
[1] ps 물론 (4)와 (7)에 해당하는 애매표에 대해서도 판정이 나면 비율이 1.5에서 살짝 벗어날 수 있습니다. 최대한 단순하게 왜 지지난 대선의 K값과 지난 대선의 K값이 다르냐를 쉽게 보여드리기 위해서 단순화한 것입니다. // 그리고 이 가설이 예를 들어 높은 연령층들이 기표실수를 더 많이 한다는 다른 분들의 가설과 꼭 상호배반적인 것은 아닙니다.
이렇게 냉정하게 생각해본 반론도나오고 토론이 이루어진다는건 건설적인 현상 같습니다.
여기에 대해서도 짧은 의견 남겨보면,
투표지에서 박근혜 쪽 무효표가 많이 나올 수 밖에 없다는 근거를 들어주셨는데,
이건 나중에 미분류표를 재집계 했을 때 ‘무효표’로 돌린 표의 경우를 말하는 것이고
이 판단에 대한 근거로는 적합합니다. 노인들이 실수 더 많이했다 또는 박근혜 자리가 무효표 찍기 좋다 등등
그런데 영화에서 말하는것은 미분류표를 재검사 해서 나온 ‘유효표’ 중에 박근혜가 많다는 부분입니다.
즉 다시 검사했는데 멀쩡한 거, 아니 이걸 기계가 왜 미분류표로 뺐지? 순전히 기계 오류가 원인인 표가 박근혜가 많다는 얘기입니다. 무효표 얘기가 아니구요.
그리고 저도 생각했는데, 뒷 단계에서 어차피 분류된 표 사람이 검사하면서 다 잡아내면 아닌가 싶죠.
하지만 참관인 증언과 영상자료등을 보면 기계가 엄청난 속도로 표를 뒤쪽으로 쏟아내고 사실상 검표단에 있는 사람은 200장이상으로 된 다발을 후다다닥 한번 훑어보고 수량세는 기계에 바로 넣는 몇초정도의 시간밖에 없어 보입니다.
일각에서 ‘수개표해야된다’ 라고 주장하는 것과 동일한 수준의 꼼꼼한 검사를 할 수 없이
200장 300장 뭉치를 슥 넘기면서 훑어봐야 하니까 그중에 혼표 1,2장 들은게 거의 검출될 수가 없다. 영화는 이논리인것 같습니다.
K=1.5 주장과 무관한 다른영상정보를 넣어서 현혹한다는 점은 동의합니다.
영화가 사람들에게 눈높이를 맞춰서 시선을 끌기 위한 장치로 보입니다.
안그러면 이런 내용 뭔소린지도 못알아먹고 관심을 안가질테니까요.
긴 댓글 남겨주셔서 감사합니다.
우선 사실관계에 있어서, 제가 적은 것은 투표지에서 박근혜 쪽 “유효”표가 많이 나올 수밖에 없다는 근거입니다. 왜냐하면 첫번째 그림(선에 걸친거)은 유효표로 인정되거든요. 그 룰이 모든 문제의 시발이라고 생각합니다. 노인이 문제다란 것은 하등 이 추론과 관련이 없습니다. 그냥 1번 후보가 변 하나에 걸친 기표를 더 유효표로 가져갈 수 있는 룰 때문에 생긴 편이입니다. 더 명확하게 적지 못한 점 죄송하고 다듬어가겠습니다.
개표에 대한 걱정은 공감합니다. 선거개표에 대한 신뢰가 무엇보다 중요하고, 저는 김어준씨의 영화는 그 신뢰회복엔 별 도움이 안 되고 신뢰를 깨는덴 큰 영향을 끼친다고 생각해서 졸저를 써봤습니다.
일리있는 걱정이라고 말
사람들이 한점 의혹이 있고 개표조작의 가능성이 0.001%라도 있다면 당연히 그 방법을 시정해봐야 할텐데 이건 무슨 선관위 대변인도 아니고 선관의의 무결점을 확신하는 방향에서 글을 쓰셨군요
김어준의 세월호 의혹제기라든지 이런것들이 거의 현실화되고 지난 정권하에서 국민들이 받은 고통이 상상을 초월하는데 단지 음모론??? 이런식으로 사안을 가볍게 여기시는 분이 계시다는 사실이 놀라울 따름입니다
아셔야 할건 선진국에서도 수개표로 돌아가는 상황이란거죠
그들이 우리만 못해서 수개표로 돌아갈까요?
현실인식을 좀 예리하게 가져보시길 바랍니다
이건 제대로 된 이메일을 입력하신 것 같아서 답변드립니다.
문제제기의 수준이 떨어지면 사람들이 문제제기를 잘 안 받아줍니다. 한국은 수개표 잘 하고 있습니다.
의기만 충전하고 스스로 사고하지 않으면 혹세무민하는 사람들한테 당합니다.
정말 기대했는대 논리적인 반박 1도 없네요. ㅠㅠ K가 1에 수렴한다는 말은 통계학의 진리입니다.희귀분포에 대해 아시나요? 이건 마치 1+1=3이란 소리를 근거없이 길게 적은글.
안녕하세요 방문해주셔서 감사합니다.
저도 통계학 할만큼 하는 과학잡니다. 희귀분포가 아니라 회귀(regression)을 말씀하시는거겠지요? 통계학적 기초를 좀더 자세히 설명해드리지 못해서 (저도 생업에 바빠서) 안타깝습니다.
역누적 결과는 어느 지역이건 별 상관없이 도시 선거구의 집계가 늦어져서 그런 것 뿐이고,
전국적으로 미분류표가 일정하게 과다하게 나온 것은 노인들이 많아서 이상할 것 없고,
그 과다하게 나온 미분류표들의 1.5:1의 비율로 나온 것은
님의 추정대로 제대로 찍히지 않은 도장 위치 때문이니 이상할 것 없다는 얘기입니까?
역누적 결과는 지역구별로 선거함이 모인 후 개표가 이뤄진 것인데다,
거리를 기준으로 선거함이 개표가 되는 것은 아닐 것이고,
공표(방송)가 먼저 된 곳 중에 도시 지역이 적이 않다는 점에서 합리적이지 못하고,
노인층이 않은 선진국, 심지어 문자로 표시하는 일본에서도
비분류표가 그렇게 많지 않다는 점에서 추정자체가 성립 안되고,
비분류표가 거의 대부분이 추정하신대로 기표했어야 함 1.5:1이 되는
(다른 가능성이 배제되어야 하는)
무리한 가정이므로 비합리적이라 판단됩니다.
이메일을 이상하게 적으셨으면 사실 발행허가를 하지 않는데, 사실관계를 환기하는 차원에서 열어볼까 싶습니다.
역누적 얘기에서 도시지역이 적지 않다는건 반론이 되지 못합니다. 일정 시점에서 개표중인 투표소들이 도시투표와 농촌투표가 공존하고 있을텐데, 막판엔 농촌투표가 힘에 부친다는거죠. 투표함레벨의 숫자가 아닌데 투표함레벨로 얘기를 해서 시청자를 호도하게 만든겁니다.
노인층이 많은 선진국… 얘기하셨는데, 제가 제시한 가설은 연령별 효과로 비분류표의 이상값을 설명하는 가설이 아닙니다. 뭔가 글을 읽다마신 것 같습니다. 일본의 기표 및 개표시스템이 한국과 비교할 수 있단 근거를 주시지 않는 이상 또한 일본을 빗대어 한 비판도 기각될 것입니다.
비분류표가 거의 대부분이 추정대로 기표했어야한다는데, 이건 저도 다 본 것 아니고 누구도 다 볼 순 없지만, 꼭 다른 가능성이 배제되어야 성립하는 수치가 아닙니다. 어차피 1.5란 값 자체는 비분류표 중에서 유효표가 된 숫자만 셌으니까요.
좋은 글이고 생각하지 못했던 부분을 잘 알려주셨습니다. 제가 추가로 제 궁금증과 아쉬운 점을 말씀드리자면,
1. 만약 영상이 암시하는 것이 다 맞다고 해도 미분류표의 비율을 인위적으로 조절하는 것, 즉 K=1.5에 맞게 한 후보자의 유효표를 억지로 미분류표로 보내는 행위가 그 인위적인 조작을 가하는 사람들에게 왜 필요한지가 의문입니다. 영상에서는 한 후보자에게서 더 많이 유효표를 미분류표로 처리함으로써 다른 표를 그 후보자 유효표 사이에 끼워넣을 수 있는 공간을 만드는 것인양 설명하는데 그 설명이 전혀 말이 안 되기 때문이죠.
처음부터 한 후보자가 받을 표의 양을 아는 사람은 개표전에는 아무도 없기 때문에 굳이 미분류표로 보낸 양만큼 다른 표를 끼워넣을 필요가 없이 안 들킬 정도로만 넣으면 되는 것이죠. 즉 혼표에 전혀 필요하지 않은 ‘K=1.5 맞추어 미분류표 생성’이라는 행위를 할 이유가 전혀 없다는 것이죠.
2. 만약 영상의 의도가 혼표와 미분류표 생성이 서로 독립적이라는 의도였고, 미분류표가 조작이 가능하므로 혼표도 가능하다는 논리라면, 미분류표를 1.5의 비율로 생성하는 것은 아무 이득없이 조작의 흔적을 불필요하게 남기는 짓인데 더더욱 그럴 이유가 없지요.
3. 만약 1,2의 경우가 아닌 뭔가 미분류표를 K=1.5에 맞게 남기는 것이 개표조작을 위해서 반드시 필요한 작업이라면 과거의 선거에 비해서 미분류표의 비율이 늘었다는 데이터라도 보여줬어야 할 거 같습니다. 영상에서 주장하는 대로 과거와는 달리 부정선거를 위해 추가된 작업이라면 미분류표가 그만큼 늘어야만 할테니까요. 영상에서는 과거 3개 선거구의 K수치가 1에 가깝다는 것만 이야기하고 미분류표의 증가여부는 말하지 않았는데요, 1:10:39 화면을 보고 대충 계산해보면 그 세 투표구의 과거 선거에서도 3-7% 정도가 되는 거 같습니다.
4. 마지막으로 김재광 교수님의 벼락2번 언급을 계속 이야기하는데 그것은 통계적으로 이 K=1.5가 나온 이 현상이 랜덤으로 K=1이 나오는 이상적 상황과 동일할 확률을 말하는 것으로 그만큼 낮다는 것은 뭔가 이유가 있다는 것을 의미할 뿐입니다. 그러나 영상에서는 이 언급에 대해 불필요한 함의를 반복해서 부여하는 것이 저는 개인적으로 가장 불편하였습니다.
좋은 글 잘 읽었습니다.
감사합니다! 말씀하신 부분들 모두 공감합니다.
1.2번에 대하여_
만약 개표장 분위기가
미분류표는 꼼꼼히 전수검사를 제대로 하고
확정표는 드르륵 넘기는 식으로 표검사를 한다고 하면
이런 식으로 프로그램을 짤 거 같아요.
미분류를 이용하지 않으면 그만큼 확정표에
다른 표(혼표)를 더 많이 섞어넣어야 한다는 말인데
현장에서 들킬 위험소지가 많지 않을까요?
프로그래머 출신인 지인한테
물어봤더니 만약 해킹프로그램을 설치한 개표기라면
모든 표를 다 처리한 다음에 숫자를 조작하는게 아니고
한 장 한 장 처리할 때마다 랜덤발생시켜서(?) 혼표도 만들고
제대로 넣기도 하고 하면서 결과적으로
1.5수치로 대강 수렴되도록 하는 게 가능하대요.
3번에 대해서_
만약에 이전 선거의 미분류표 비율이 3%대였다면
그걸 보고 너무 튀지 않게 프로그래밍 할 거 같아요.
기계가 업그레이드가 되어서 미분류표를 확정표로
분류할 수 있는 능력이 상승되었다면
미분류비율이 줄어들어야 맞겠지만.
모든 건 가정일 뿐입니다. 그리고 저는
지난 대선에서 개표부정이 있었다,
부정선거다, 이렇게 보지 않아요.
그런 주장을 하시는 분들은
증거가 부족합니다.
가정일 뿐인 걸로 방향을 정해놓고
계속 추론을 하게 되면
함정에 빠져요.
제가 관심 있는 건 시스템의 허술한 점이고
그걸 보완해야 한다는 점이예요.
댓글 달아주셔서 감사합니다.
과학에서 금언이 있습니다. extraordinary claims require extraordinary evidence (화끈한 주장은 화끈한 근거가 필요하다).
시스템의 허술한 점들은 보완되어가고 있고, 우리 선거결과가 바뀔 걱정은 조금 덜 해도 될 것 같습니다.
1.미분류표로 보낸 양만큼 다른 표를 끼워넣을 필요가 없이, 안 들킬 정도로만 넣으면…..총 개수가 안맞지 않나요. 나중에 총개수도 당연히 세게 되니까요. 그래서 혼표를 해서 개수를 맞추죠, 즉 후보가 받은 표들 속에, 다른 후보의 표가 들어가도록 하고, 검표를 계수기로 하기 때문에 계수기 속도를 100에서 하지 않고 200, 300으로 하면 볼수도 없으므로, 그냥 넘어가는 거죠.
김어준도 계속 얘기하는 것인데… 1.5가 중요한게 아닙니다… 개표에 외부 조작 개입의 여지가 있다는 게 중요한거죠… 그리고 투표용지와 투표결과 보관이 5년이내… 이건 분명히 문제가 있는것이죠…
개표 및 검증이 투명하게 무기한으로 몇번이고 할 수 있게 되어야 할 것입니다
댓글 달아주셔서 감사합니다. 우려사항 충분히 이해가 갑니다. 하지만 모든 제안에는 비용이 뒤따르기때문에, 단단한 의혹제기가 필요하다 보는데 이에 김어준씨의 의혹제기는 미달한다고 판단합니다.
분류기를 통과후 미분류표는 3.6%이고 최종 무효표는 0.3%입니다. 즉 무효표를 제외한 미분류표가 3.3%인것이죠.
가정하신것과 같이 7군데 중 4,7이 무효라면 3.6% * 2/7 = 1.03%가 최소 무효표로 분류되어야 합니다.
댓글 달아주셔서 감사합니다.
어떻게 기계의 오류나 편이 없이도 저런 편이가 발생할 수 있는지를 설명하기 위해서 단순화한 면이 큽니다. 이 점 제 불찰입니다 (ps로 덧붙여놨습니다). 4,7이 언제나 무효가 되는건 아니고 분명하게 어디에 더 걸쳐있으면 유효표 판정이 될겁니다 (그 경우 K값은 1.4 등으로 떨어질 수 있겠습니다). 사실 이 의혹제기가 흥하는 가장 큰 것이 K값 1.5에 있기때문에, 이 부분에 대한 대체가설들 중 하나로 봐주시면 감사하겠습니다 (다른 연령에 따른 기표오류 증가 등의 이야기들도 있는걸로 알고 있습니다).
전 하나의 사실만 말씀드리겠습니다
님께서 논의신 것은 한가지 사실을 말해주지못합니다
이전선거에서의 k값이나 무효표 비율울 어떻게 설명하실건가요
무효표 논란은 님께서 추론으로 설멍하신것은 우리나라 모든 선거에 해당하는 것인데 자료가 부족하긴하지만 확인된것으로는 18대 대선 결과를 설멍하지 못합니다
안녕하세요, 댓글 달아주셔서 감사합니다.
이전 선거에서는 무효표 판정 기준이 달랐습니다. 공직선거법 179조 4항을 보시면 변경사항을 확인하실 수 있습니다. 그 땐 엄격하게 유효표를 판정해서 아마 저런 효과가 적었지 않나가 추정이 되겠습니다. 본문에 썼는데 잘 강조가 안 된 것 같네요. 감사합니다.
기계를 이용해 분류를 하고 이 표를 사람이 수개표하는데 기계 분류 과정이 조작될 가능성이 있고 조작되었을 경우 수개표 과정에서 이를 알아채기가 어렵다. 라는 것이 영화의 주된 주장이라고 봤습니다. 따라서 수개표 과정에서 알아채기 어렵다는 것을 좀더 명확하게 보여줬으면 좋았을텐데 그러지 않아서 아쉽더라구요. 영화에서 개표 상황을 보여주는 영상이나 개표한 사람들의 인터뷰가 잠시 나오긴 하지만 분량이 짧았던 것 같고 특히 마지막에 실험과정에서도 개표 과정이 없어서 아쉽다고 생각했습니다.
1. 개인적으로 현재의 방식으로 그대로 할 때 ‘개표 과정에서 분류 오류를 알아채기 어렵다’라는 것에 동의를 하는 편입니다. 그래서 영화가 이부분을 너무 짧게 지나가서 더 아쉬웠구요. 이 부분에 대해서 어떻게 생각하시는지 궁금합니다.
2. k값이 1.5가 나오는 이유에 대해서 꽤나 납득할만한 설명을 해주셨다고 생각합니다. 김어준은 더플랜 이전에도 미분류표에 대한 의혹을 제기해왔었고 심지어 이렇게 영화까지 만들었습니다. 그럼에도 선관위가 전혀 대응을 하지 않은 이유는 무엇일까요? 혹은 이런 무대응으로 일관하는 태도에 대해서 어떻게 생각하시나요?
3. 위에 쓰신 댓글중에 이 영화가 신뢰를 깨고 있다고 하셔서 좀 놀랐습니다. 신뢰라는 것이 단순히 믿는 것 보다는 계속되는 의심과 검증을 통해 만들어진다고 생각해서요. k=1.5라는 수치는 어쨋든 사람들이 의구심을 가질만한 수치고 더플랜의 주장이나 작성자님의 주장이나 둘다 합리적인 가설이라고 생각합니다. 실제로 어떤지는 다시 재개표를 하지 않는한 알 수 없다고 생각해요.
미분류표를 분류하는 과정에서 1번이 유리하다는 주장(의심)이 있었을 것이고 이에 따라 후보간 칸을 벌리는 것으로 투표는 좀 더 신뢰할만한 시스템을 갖추게 되었습니다. 그렇다면 전자분류가 조작될 수 있고 이것을 수개표시 알아채기 힘들다는 주장에 대해서도 투표의 신뢰를 더 키울만한 대응이 있을 수 있지 않을까요? 그렇게 해서 투표가 좀 더 신뢰할만한 시스텝을 갖추게 된다면 그래도 여전히 이 영화가 신뢰를 깨트린다고 생각하시나요?
4. 영화에서는 먼저 수개표를 하고 기계로 확인만 하자고 했는데 저는 사실 먼저 손으로 분류만 해도 좋을 것 같습니다. 사람이 분류하고 기계로 확인하고 지금처럼 수개표 하는 식으로요. 이런 방식은 어떻게 생각하세요? 여전히 지나치게 비효율적인가요?
이렇게 댓글 달아주셔서 감사합니다. 저는 마지막 실험과정에서 검표과정이 없었던 것때문에 사실 너무 야바위친다고 생각했던 사람입니다.
1. 그 부분은 의혹으로 제기할 수 있겠지만, 아무런 근거가 제시되어 있지 않기 때문에 가려야한다고 생각합니다. 설사 천번 받아들여서 그렇다고 하더라도 — 예를 들어 모든 백장 묶음중에 1표씩 딴걸 넣는다고 하더라도 당락을 바꿀 수준이 되기 어렵습니다.
2. 간단히 말해, 명확하게 대응하기 어려운 의혹제기여서 그런게 아닌가 싶습니다. 데이터를 파봐서 뭔가 상관관계를 보였는데, 사실 K값이 1이 될 엄밀한 이유가 없고, 의혹제기자 자체도 정규분포 등 통계에 대해서 쫌 이해도가 떨어지는데다가(통계학자분들께서 학회에서 포스터 발표하신 부분이 있는데 어떻게 정리되었는지 유감스럽게도 못 봤지만, 초록 정도로 볼 때도 강한 의혹을 제기했는지 의문스럽습니다) 여러가지 설명 가설들이 있을 수 있기 때문에 (본문에선 상술하지 않았지만 1,2번 투표자의 기표실수율이 다를 가능성) 자세히 살펴봐야할 것입니다. 그런데 그걸 살펴볼 원자료 (미분류된 표들)가 있는지 모르겠습니다.
3. 저는 의혹제기는 언제나 좋은 효과와 부작용이 같이 있다고 생각합니다. 부작용은, 그 의혹제기에 대응하는데 들어가는 비용뿐만 아니라, 의혹제기때문에 이 경우 투표율이 떨어진다든지, 정치적 지지자들이 더 극단적인 주장들을 한다든지 하는 것들이 포함되구요. 그래서 좋은 효과를 극대화하고 부작용을 최소화하기 위해서 단단한 근거들로, 보수적인 문법과 방법론으로 해야한다고 봅니다. 아니면 센세이셔널한 의혹제기들로 인한 부작용이 심할 것입니다(실제로 미국도 자극적인 음모론때문에 업무가 마비되거나, 사회기구가 잘 동작하지 않는 경우가 많습니다). 그런 면에서 형식적으로 영상이 너무 막 나갔고, 그래서 우리나라 선거시스템에 대한 불신을 키웠고 기타 부작용은 큰데 (예를 들어서 박근혜후보를 지지한 사람들의 목소리에 귀를 닫는다든지) 그에 비해 실익이 너무 없는 수준이었다고 판단합니다.
4. 저는 수개표만 하던 시절을 잘 기억하고 있습니다. 수개표는 사실 실수가 나기 훨씬 더 큽니다. 사람들이 천양지차이고 (대개 교사나 은행원을 동원합니다) 밤늦게까지 작업하니까요. 그래서 검표도 복잡해지고 감시도 힘들어집니다. 그 비용에 대해서 전혀 논의하지 않고 간단한걸 왜 안 하냐라고 하는 것도 정말 정직하지 못하다 봤습니다. (본문에 쓴 바 있습니다)
제 생각과 동일한 생각을 가지신 분이 그 생각을 일목요연하게 정리한 글이 여기 있었군요.
김어준의 광신도들은 전자 분류기에서 미분류로 보내지는 ‘유효’ 표와 분류로 보내지는 ‘유효’ 표의 차이를 이해하지 못하고 있습니다.
뭐 때문인지 몰라도 두 종류를 네모 칸에 정 중앙에 마킹한 표라고 인식하고 있어요.
그러니까 영화에서 동전을 던졌을때 앞 뒤가 나올 확률은 50%로 수렴해야 한다, 빨간공 파란공이 50:50으로 섞인 주머니를 컨테이너에 풀었을때 96짜리 구멍이나 4짜리 구멍에 동일한 비율로 분류되야 한다는 잘못된 예시를 철썩같이 믿고 있는거지요.
이 음모론자들을 닥치게 할 확실한 방법은 지난 대선때 미분류로 분류되었던 표들의 실제 이미지를 보여주는 법 밖에 없습니다. 아니 보여줘도 조작된 표라고 우길겁니다.
잘 읽었습니다.
감사합니다. 미분류표 예시들을 보여주면 좋을텐데, 실제로 대선 당시 표들의 representative한 표들을 여전히 보관하고 있는지 궁금하긴 합니다.
솔직히 더플랜 영상도 의문점 투성이지만 이 글도 별반 차이가 없네요. 형식? 을 비판하셨는대 더플랜이 뉴스나 보고서도 아니고 영화아난가요? 당연히 영화는 제작자의 연출이 개입하기 마련인대 예술 특히 영화장르에 대한 인식자체가 부족하신분이네요. 뭐 자칭 과학자라고 하시니 영화를 제대로 못보실수도 있다 생각합니다. 정말 논리적인 펙트로 반박하는걸 기대하고 온게 잘못이죠.
댓글 남겨주셔서 감사합니다.
영화적 형식을 사실로 받아들이고 나아가 박근혜후보가 부정 당선 (사실 다수는 문재인후보 지지자)라고 인식하는 사람들도 포털 댓글창들 보면 상당수인 것이 아닌가 우려됩니다. 그런 부작용, 사회적 해악이 너무 크게 보여 적었습니다. 글이 부족해서 그 우려가 전달되지 않은 점 유감입니다.
이 분류기는 프로그램머블입니다.
최소한 분류기의 컨트롤 프로그램들은 매 개표에 앞서서 공개되고 검증되어야 하지 않을까요?
그래야 1.5가 수긍가능한 수라고 주장할 수 있을 것 같네요.
댓글 남겨주셔서 감사합니다.
프로그래머블하다는 말씀은 맞는 말씀입니다. 제가 이해하기로는 그 말은 또한 기계를 “적당히 고장낼 수 있다”라고 말하는 것과 다름이 없어 보입니다. 검표과정을 더 신경쓰면, 기계가 야바위칠 수 있는 가능성은 적어도 영화를 통해서는 확인하지 못했습니다.
더해 어떻게 공개되고 검증해야할지 잘 생각해봐야할 것 같습니다(어떻게 미분류된 테스트 표들을 만들어낼지 등). 알고 계신 보안 전문가분께서도 잘 검증하면 될 것이라고 하셨는데, 저는 지금까지도 검증을 안 했다고 보진 않습니다. 그리고 과연 그런 검증이 수개표하자는 분들을 만족시킬 수 있을지 자신이 없습니다.
분류기에 문제가 있지 않은 이상 1.5라고 하는 K값은 설명이 안 될 거라고 생각했었는데, 이걸로 설명이 되겠구나 싶네요. 영화보고 나서 16대, 17대, 18대 대선의 각 무효표 비율을 확인해봤는데 갈수록 획기적으로 줄어드는 걸 볼 수 있었습니다. 특히 박근혜 지지 지역 중 노인 인구 비율이 높은 곳에서는 낙폭이 더 컸습니다. 무효표 기준이 바뀐 것이 원인이라면 납득이 되네요. 하지만 투표용지에서 1번 프리미엄이 유지되는 상황에서 스트라잌존 넓히듯이 무효표 기준이 완화됐다는 건 영 찝찝합니다. 선관위에서는 나중에 파악이 돼서 고쳤다고 하겠지만요.
아니, 다시 생각해보니까 1번 프리미엄이 있는 상황에서 무효표 기준이 바뀐 게 아니라 무효표 기준이 바뀌어서 1번 프리미엄이 생겼다고 하는 게 맞지 않나 싶네요.
감사합니다. 저도 그렇게 생각합니다. 그 의도야 관심법이 없으니 모르지만, 저는 이런 효과가 클 것이라고 중앙선관위에서 “설계”했다고 상식적으로 믿기 힘들었습니다. 무엇보다 이런 식으로 프리미엄 붙어서 최소한 대선에선 당락과 관계가 없는 수준의 차이만 생겼을 것 같습니다.
네. 여러가지 요소가 K값을 1과 다른 값으로 만들 것이라고 생각하고, 그 중 한 가지 아주 간단한 예시를 들었을 뿐입니다.
선관위가 알고서 무효표 기준을 바꿨냐고 하면 제가 이해하기로 이런 기준들은 공직선거법에 규정되어 있고 (179조 4항?) — 즉 국회에서 기준을 정하는거지요 — 지금까지 방향은 기표자의 의도를 최대한 선의로 해석해주자는 쪽으로 바꿔나가자에 가까웠던 것이 아닌가 싶습니다. 옛날에는 조금만 선에 찍혀도 자기 표가 무효표가 되어서 아우성이 심했다는 기사들을 본 기억이 납니다. 이런 의혹제기들에는 어느 정도 양쪽의 처지를 중립적으로 판단할 필요가 있을 것 같습니다 (그걸 잘 안 했다는게 김어준씨의 더플랜에 대한 제 개인적 생각입니다).
1)
선거때 마다 미분류율이 차이를 보인다면 어느정도 기준선까지를 미분류로 처리할 것인지 분류 프로그램으로 설정될 수 있다고 생각합니다.
오히려 애매하게 기표된 투표용지를 미분류로 처리하면, 개표현장에서는 분류된 후보자표보다 아무래도 미분류로 분류된 표는 ‘판정’이라는 절차를 거쳐야 합니다.
미분류 비율이 높다는 것과 부정선거와 관련성이 없다고 생각합니다.
오히려 분류된 표에 다른 후보의 표가 일정 비율로 섞여 있다면 모를까요.
개표현장에 참관인들이 많을텐데 아무리 피곤하고 책임감이 낮다고 주장해도
문제되는 표 하나 잡아내지 못하고,
섞여있는 표 하나 잡아내지 못할까요?
일단 잡아내면 모든 프로세스는 납득할 때까지 다시 진행된다고 알고 있습니다.
2) 투표소 수개표를 도입한다고 해서 개표 논란이 종식될거라는 점에 동의하지 않습니다. 지금의 과정도 부정선거와는 전혀 관련이 없지만, 논란을 사전에 예방한다는 차원에서 대선의 경우 투표소가 아니라 개표소 수개표는 도입해 볼 만합니다.
하지만, 합리성이 낮은 의혹에 날개를 달아주지 않을지 하는 생각이 듭니다.
얼마 전 조응천 의원이 파파이스에서 당선 사진을 놓고 김어준씨와 감회를 나누던 대화를 들었습니다. 처음에 지고 있다고 막판에 사전투표함에서 몰표가 나와서 본인이 이기게 됫다는 내용이었는데, 김어준씨 말이 ‘자기들이 사전투표함을 지켰기 때문에 이긴거다’라고 하더군요.
전 그말 한방에 나가 떨어졌습니다. ㅎㅎㅎ
사전투표라는 개념을 누가 알았을까요? 투표제도에 관심이 있는 사람이 누가 있었을까요? 선거제도도 아니고.
하하하. 맞습니다. 제도가 어떻게 진행되는지에 대해서 잘 공부하고 나서 자기의 기여와, 의혹 등을 제기해야하는데, 그 부분에서 더플랜에서 인용된 학자분들 (또는 그렇게 연출한 김어준)에게 아쉬움이 많습니다.
댓글에 완전 동의합니다. 댓글 달아주셔서 감사합니다!
더 플랜, 보나마나 헛소리일 것 같아 안봤습니다. 여기저기 오른 글들 읽어보니 역시 제 예상대로네요. 더 플랜보고 들뜬 분들, 제발 이번 대선때 투개표 참관인 신청해서 지루하게 전과정을 한번 지켜보길 권합니다. 특히 참관인 모집하기 힘든 시군구 단위에서 하면 더 좋습니다. (알바비도 줄겁니다) 얼마나 좋습니까? 본인의 의혹을 직접 확인할 수도 있고 후보에게 도움도 되고 이런 거보고 일거 양득이라 하죠. 내가 직접 안봤고 모르는 분야니까 믿을 수 없어라고 떠드는 분들은 직접 경험하는게 제일 좋습니다. 직접 참여하고 땀을 흘린 사람들이 별 말 안할 땐 다 이유가 있는 겁니다. 전 수개표로 진행했던 87년 대선, 군부독재 재집권 막겠다고 참관인 신청해서 뜬 눈으로 밤을 세웠습니다. 최근에도 모 정당 경선 과정 직접 다 참여했습니다. 수개표로 해야 정확하다구요? 웃겠습니다. 문재인 후보를 내세운 민주당이 바보라서 현장 경선에서 계수기쓰고 분류기 쓰고 하는게 아닙니다. 노무현 당선 당시엔 왼쪽 진영에서 전자적 방식이 새시대의 징표라며 옹호했던 반면 이회창 쪽에서 수개표만이 정답이라 우기다 결국 망신 톡톡히 당하고 끝났는데 이제 입장들이 반대가 된 걸 보니 씁쓸합니다.
너무 맞는 말씀입니다. 이 블로그 시스템에 추천시스템이 있었다면 맨 위로 보내고 싶습니다.
질문입니다. 1.5라는 숫자가 미분류표중에서 박근혜외 문재인의 유효표를 카운트하는 방식때문에 박근혜가 1.5배 유효표가 나올 가는성이 있다는 주장은 생각하지 못한 부분이네요. 그렇다면 미분류표 중에서 박근혜와 문재인의 표의 비율이 1.5를 중심으로하는 정규분포표가 그려져야 하죠. 하지만 다큐에 나온 1.5는 미분류표내에서 박근혜가 문재인보다 1.5배 많다는 의미가 아니죠. 미분류표 내에서 두 후보의 표 비율을 분류표 내에서의 비율로 나누었을때 1.5가 나온다는 뜻이잖아요. 이 부분에 대해 좀 헷갈리신거 아닌가요.
다시 생각해보니 제가 잘못 이해한 부분이있었네요. 말씀이 이해가 갑니다. 그런 이유로 1.5라는 숫자가 나왓다면 박근혜와 다른 후보들간의 k값 역시 1.5, 박근혜와 마지막 후보 k값은 1, 후보들간의 k값은 1에 근접해야하는데 이게 어떻게 나올지 궁금하군요
저도 궁금하긴한데, 애매표는 3%밖에 안 되는데, 다른 후보들의 득표가 너무 적어서 통계적으로 유의하게 판단할 수 있을지 자신이 없습니다. 원본 데이터를 갖고 있는 김어준측이나 선관위에서 분석해서 정리해줬으면 하는 소망이 있습니다. 노파심에, 저는 한 가지 대체 가설을 제시했을 뿐이고, 다른 많은 분들이 지지자들의 기표실수 편향때문에 K값이 다른 값이 나올 것이라고 예측하시기도 합니다. 충분히 경청하고 일리 있는 지적들인 것 같은데, 저는 김어준측에서 연령효과가 없단 얘기를 하는걸 봐서 (어떻게 분석했는지 보고 싶습니다) 그 외의 가설을 제시해봤습니다.
댓글 달아주신 것 감사합니다.
헷갈리지 않았습니다. 그 투표구에서, 1번에 찍을 사람들과 2번에 찍을 사람들의 비율은 당연히 1:1이 아닐 것입니다. 따라서 1.5란 프리미엄 자체는 얼마나 많은 박근혜/문재인 지지자들이 해당 투표함에 투표했냐를 당연히 감안(normalization)해야합니다. 그 배경 하에서 1.5배 정도의 이득을 얻는 시나리오를 (당시 무효표 판정 시스템 하에) 생각하는게 어렵지 않단 말씀을 드렸던 것입니다. 또한 다시 강조하는데, 이런 효과 외에도, 각 지지자들이 기표에 실수할 확률이 많이 다르면 또한 이도 비율에 영향을 줄 것이고 제가 제시한 가설과 상호배반적인 것은 아닙니다.
노바디님의 주장대로 K 값이 1보다 커질 수 있겠지만, 곰팅님 말씀대로 1.5를 충분히 설명하긴 힘들것 같습니다. 2007년 대선 결과의 K 값과 비교를 해볼 수 있으면 좋을텐데.. (물론 분류기와 투표지가 크게 바뀌지 않았다는 가정 하에.)
만약 제가 설계자라면 이랬을 것 같습니다.
1. 박근혜의 승리를 위해, 박근혜의 가짜표를 늘려야 한다.
2. HG 님 말대로, 문재인 표를 박근혜 표로 가져오는 게 간단하지만 (100장 중에서 1,2장만 넘겨도 큰 효과) 명백한 문재인 표를 보내는 건, 참관인의 눈에 걸릴 확률이 있다. ‘애매한’ 표를 혼표해야 걸릴 확률도 낮아지고, 걸리더라도 기계 오작동으로 넘어갈 수 있다.
3. 기존 선거를 봤을 때 미분류표 비율이 3% 이상으로 높다는 구멍을 활용해 보자. (기계가 보기에 조금이라도 애매하다 싶으면, 정확한 사람 눈으로 확인하는 프로세스). 미분류표 비율을 높이면 의심을 살 수 있으므로, 이 값은 유지하면서.
4. 따라서, 스캔 결과 ‘애매한’ 표가 감지되면 (예를 들어, 박근혜와 문재인 사이에 30~70% 정도 걸쳐 있는) 박근혜 표로 혼표한다. 그리고 그만큼의 박근혜 표를 미분류 표로 보낸다.
노바디님이 보시기에 어떤가요?
글이 길어지네요. 중요한 건 저희 선거 방식에 허점이 있다는 사실 아닐까요. 노바디님이 지적하셨듯이, 1번에게 유리한 투표 용지를 설계자가 활용할 수도 있는 것이구요.
저도 영화에 아쉬운 점은 있습니다. 다른 것들 제쳐두고 1.5에만 집중해도 좋지 않았을까 하는 생각을 했구요. 더 꼼꼼하게 가설의 검증 과정을 거치고, 내 선의을 경계하며 항상 ‘정확히 아는 것’을 견지해야 한다고 생각합니다.
그럼에도 제가 김어준을 응원하는 이유는, ‘뭔가 이상하지 않느냐’는 질문을 이렇게 크게 던져준 것만으로도 고맙기 떄문입니다. 이 짧은 시간 안에, 제한된 예산을 가지고, 대중이 이해할 수 있는 언어로 문제를 제기해줬으니까요.
1.5의 원인이 ‘플랜’일 수도 있고 아닐 수도 있습니다. 그럼에도 이렇게 서로 토론을 하면서, 서로의 부족한 부분은 채워가면서, ‘정확함’을 향해 다가가는 과정에 이 영화가 던진 질문이 마이너스가 된다고는 보지 않습니다..
그가 충분한 증거 없이 1.5의 원인으로 ‘플랜’을 주장하는 건, 다른 이유를 찾을 수 없어서일 것입니다. 충분히 더 시간을 가지고 검토해 볼 수도 있었겠지만 대선이 얼마남지 않았고, 이 진흙탕 싸움에서 진흙을 아예 묻히지 않고 싸우기란 불가능하지 않을지…
평소에 노바디님 트윗 잘 보고 있었는데, 너무 노여워 하시는 것 같아서 이렇게도 한번 봐주시면 어떨까 싶어서 두서없이 글 남겨봅니다. 덕분에 더 고민할 수 있었습니다. 감사합니다.
ps. 김어준에게 참고하라고 sisakfc at gmail.com 이메일로 노바디님 글을 보내볼게요.
감사합니다. 아니 뭐 이메일로 보내실 것까지 없습니다. 김어준씨에 대해선 옛날에 황우석씨 의혹제기할 때 (그러니까 황우석씨 옹호) 많이 실망했던 적이 있었습니다.
김어준씨도 사회적 역할이 있다고 보지만, 우리나라 정치 자체가 너무 막후에서 벌어지는 일들을 추정해야할만큼 나빠서 결국 이렇게 사고치는게 아닌가 하고 안타까운 마음도 있습니다. 우리나라 선거 방식이 완벽하다 할 순 없지만, 필요이상으로 설익은 의혹을 제기하는 것이 얼마나 큰 손해를 끼칠지 걱정되어서 썼다는 점을 이해해주셨으면 합니다. 당장 박근혜 대통령 지지자 수가 다수가 아니었다고 믿는 사람들이 생기고, 이런 사람들은 문재인/안철수가 경쟁하는 과정 중에 안철수 지지자들의 목소리를 들을 필요가 없다고 하기도 합니다. 이런게 제대로 토론하고 정리해나가는 정치문화에 해악을 끼친다고, 부족하지만 작은 제 정견(?)을 적어봅니다.
댓글 달아주셔서 감사합니다.
이게 아마 더플랜의 캐나다 학자님의 한 가지 시나리오인 것 같습니다. 그냥 아주 단순하게, 이런 식으로 해도 박근혜 총득표수와 문재인 총득표수차를 뒤바꿀만큼 큰 효과가 있기 어렵다고 (아주 거칠게) 계산해봤었습니다. 왜냐하면 그렇게 혼입하기 위한 “애매한” 표의 수 자체가 그렇게 많지 않기때문입니다. 제 계산이 틀렸을 수도 있는데, 대선만큼 큰 선거에서 참관인들도 있는데 이걸 대규모로 바꾸기 쉽지 않게 설계되었다고 저는 선관위 시스템에 대해 (더플랜에서 나온 이 전 판사님처럼) 믿는 편입니다.
한가지 궁금한 것이 있습니다.
미분류표의 비율이 이미 분류된 표의 비율을 따라야 하는 이유가 있는지 저는 개인적으로 궁금하더군요. 미분류란 투표함에서 무작위 표본추출을 한 것이 아닌데, 분류한 표에 대한 대표성이 보장되는게 맞나 하는 생각이 듭니다.
다시 말해서 투표함에서 3.6퍼센트의 표를 무작위로 꺼낸 것과, 분류기를 통과해서 3.6퍼센트의 미분류가 나온 것이 같은 표본인가 하는 점입니다.
댓글 감사합니다.
넵. 맞습니다. 그게 잘 안 들어와서, 설사 그렇다고 하더라도 이럴 수 있다고 정리해본 것이었습니다.
안녕하세요, 선생님. 주제넘은 이야기라 민망하지만, 부탁을 드리고픈 게 있어 이렇게 댓글 남깁니다.
저는 ㅍㅍㅅㅅ http://ppss.kr 라는 웹진을 운영하는 이승환이라고 합니다. 저희 웹진은 주로 인터넷에 깊이 있거나 재치 있는 글을 올리는 분들의 허락을 얻고 사이트에 글을 재게재하여 좀 더 많은 사람에게 알리는 방식으로 운영합니다.
우연찮게 지인의 페이스북을 통해 선생님 블로그를 통해 깊이 있는 이 글을 보게 되었습니다. 행여나 실례가 되지 않는다면, 블로그에 올리신 글을 ㅍㅍㅅㅅ에 재게재할 수 없을지 여쭙고 싶습니다.
비록 당장 원고료를 드릴 수 있는 상황은 아니지만, 이전에 지금까지 모든 글에 3만원 씩을 지급했던 것처럼, http://ppss.kr/archives/40657 여유가 되는대로 또다시 지급하고자 노력하고 있습니다.
당연히 출처는 밝히고, 간단한 필자 소개도 들어갑니다. 괜찮으시다면 간단한 답신을 head@ppss.kr 로 받을 수 있었으면 합니다. 앞으로도 좋은 글 많이 부탁 드립니다. 감사합니다.
이승환 드림.
안녕하세요, 가끔씩 좋은 글들을 읽곤 하는 독자이기도 합니다.
부족한 글 잘 봐주셔서 감사한데, 블로그에서 소소하게 이렇게 의견교환해가면서 저도 생각들을 정리하려고 하고 있습니다. 글 말투 자체가 너무 단정적으로 쓴게 아닌가 하는 걱정들도 있고, 제 주변 지인들이랑 물어보면서 어떻게 검증해야하는지, 등등에 대해서 더 공부해가고 있습니다. 그래서 이런 설익은 한 주장을 ppss처럼 대표성이 있는 언론(?)에 나가는 것은 부담스럽습니다.
한편으론 수긍이 되는 글이네요. 처음으로….^^
그런데 기본 전제가 모든 혹은 대부분의 무효표가 양쪽에 걸쳐지도록 도장이 찍혀야 한다는 것이어야 이 논리가 성립될텐데…
영화에서는 ‘무효표가 아닌 정상표인 경우에도 의도적으로 무효표로 돌려졌다’라는 설명이던데… 이런 경우라면 위의 설명은 들어맞지 않네요.
무효표를 직접 눈으로 확인해 보지 않은 입장에선 알 수 없는 일인지라…. 정확치는 않지만… 확인이 필요한 상황일 듯 합니다.
댓글 달아주셔서 감사합니다.
여기까지 온 이상, 사실 그 부분이 가장 중요하게 선관위에서 보여줬으면 하는 바람입니다. 저는 믿음이 있어서 애매한 표들이 압도적 대다수로 미분류되었을 것이라고 보지만, 김어준씨 측에서 정상표가 미분류되었다고 하고 애매표를 혼입시켰다고 이렇게 크게 말하는 이상 19대 대선 전에 어느 정도 검증은 이뤄질 것이라고 생각합니다.
올리신 글 잘 읽었습니다.
“미분류표에서 기표용지 1번의 프리미엄”이라고 이해했습니다.
분류기 조작을 배제한 채, K=1.5에 대해 가장 설득력 있는 가설입니다.
댓글 달아주셔서 감사합니다.
노파심에, 다른 가설을 밀고 계시는 분들도 많이 보고, 일리 있다고 생각하고 있습니다. 게다가 제가 제시한 가설과 이율배반적이지 않습니다. 지지자들마다 기표실수에 차이가 있다는건데요, 그 기작이 어떻든 (개표기 조작에 그 많은 대선 검표인원들을 모두 속이기마저도) 규모가 18대 대선 당락을 바꿀 정도가 되지 않다란 점은 변함 없다고 생각합니다.
좋은 글 잘 읽었습니다.
다행이라고 생각하면서 더플랜의 주장에 대해
다시 체크해 보게 된 점 고맙게 생각합니다.
그런데 제 의견은
개표기에 해킹프로그램 설치 가능하다는 건 팩트인 거 같고요.
개표기 개선은 해야 한다고 생각해요.
보완완벽하다, 해킹이 불가능하다..
선관위에서 자꾸 말로 해명하는 식보다는
투표에 대한 신뢰를 높이는
근본적인 해결책을 내놓는게 좋겠다고 생각해요.
지금으로선 가장 현실적인 방법이
개표기에서 분류된 표를 2차, 3차 재검한다고 했는데
이 재검표 과정이 얼마나
꼼꼼하게 이루어지는지 체크하는 게 관건일 것 같습니다.
선거개표인이
혼표가 없는지 한 장, 한 장 잘 세는 건지
또 모든 투표용지 수를 직접 계수해서
집계하는지 그걸 확실히 점검하고 감시해야 할 것 같습니다.
김어준씨에 대한 호, 불호를 떠나서
의혹이 있는 부분에 대해서 명쾌하게 정리되길 바래요.
왜 K값이 이렇게 전국적으로 골고루 높은지에 대해선
의아하고 ‘통계적으로 그렇게 나올 수 있어요.’라는
입장이신 것 같은데 잘 이해가 되지는 않았어요.
대체가설 중 하나인,
1번자리 프리미엄때문이라는 가정도 하나의 가정일텐데.
16,17대 대선자료랑 비교해 보면 확실하겠지만
그건 어렵다고 하니까요.
암튼 좋은 자료로 균형있게 볼 수 있는 시각을 열어주셔서
고마워요~~
넵. 잘 봐주셔서 감사합니다.
저는 조작은 수많은 가능한 설명들 중 극히 일부분의, 사실 아주 화끈한 가설이라고 생각합니다. 화끈한 설명엔 훨씬 더 단단한 근거들이 뒷받침되어야한다고 생각합니다.
개표기가 해킹 가능하단 말씀에는, 넵, 컴퓨터는 절대 해킹 불가능한 컴퓨터를 만들 수 없습니다. 그런데 그래서 사람을 쓰면 너무 오래 걸리고 (전 옛날 개표기가 사람 수개표를 도와주기 전 시절 선거들 개표가 얼마나 오래 걸리는지 기억납니다) 오류도 훨씬 많아 2,3,4중으로 재검해야해서 그 비용이 막심하다고 이해하고 있습니다.
1로 수렴하는 게 맞아요. 혹 희귀분포라 하더라도 1.5가 나온다는 건 인위적 편형이 없이는 설명이 안됩니다.
감사합니다.
좋게 말해서, 인위적 편형이 개표기에서가 아니라, 다른 요소 — 무효표룰때문에 생길 수도 있다는 점이 전달되지 않은 것 같아 아쉽습니다.
영화엔 나오지 않지만, 일본은 손으로 쓴 정치인이나 정당 이름을 스캔하는데 우리보다 더 낮은 수준의 오차율을 가지고 있다고 한 적이 있습니다. 우리의 도장 찍기 방식이 다른 나라보다 식별하기 어렵다고 하는 건 믿기지 않습니다
도장찍기 방식이 식별하기 어렵다는게 아니라, 우리나라 방식이 “애매한 경우”가 나오기 쉬운 것은 분명한 것 같습니다.
사람 이름 쓰면 어디에 쓰던 뒤로 쓰던 좌로 쓰던 식별가능하지만, 똑같이 생긴 동그라미가 정확히 어떤 위치에 있느냐를 확인해야하는거니까요. 그 점을 감안하시면 일본과 직접 비교가 어렵다고 생각합니다.
K값 1.5 관련 이 트윗 타래도 도움이 될 것 같아 댓글로 남깁니다.
https://twitter.com/aichupanda/status/853276671079624704
요지는 실제 K값이 0.97에서 2.17까지, 전국적으로 전혀 일정하지 않았다는 것이고, K=1.5 세팅이 있었다면 이런 식으로 비율 차가 크게 날 수 없다는 것입니다.
감사합니다.
넵. 정규분포를 이뤘다는 것 자체가, 이게 막 조작했다는 것을 어렵게 하는 큰 증거라고 생각합니다.
사실 러시아 대선 같은데는 개표조작이 이뤄지는 것이 학술적으로 활발하게 논의되고 있는데, 여기 중요한 팩터가 숫자 분포들이 예상된 분포 (거기선 정규분포는 아니지만 통계적으로 같은 맥락입니다)를 이루지 않는다는겁니다.
조금 의문이 드는 것이 말입니다.
1번과 7번이 다르다고 하더라도, 7번의 경우에도 유효표일 가능성이 있는 것들이 있잖아요. 아주 단순하게 7번의 경우는 절반만 걸치는 것까지 인정한다고 하더라도 대충 K 값은 1.2 정도가 되는 것 같은데요.
게다가 저 당시에는 3번이 사퇴한 상황이어서..하긴 3번이 사퇴했다고 하더라도 3번으로 찍은 것으로 판정되는 건 가능하니 크게 상관은 없을 수 있겠군요.
사실 주장하시는 것이 정말 유의미한지 보려면 별도의 통계적 가설로 만들어서 판정해봐야겠습니다만..어쨌든 무슨 말씀인지는 잘 알겠습니다.
감사합니다.
저는 이게 맞다!라고 주장하기보다는, 이런 대체가설 (사람들이 가장 이해하기 쉽게)도 있을 수 있으니 조작 주장하는 것은 앞서나간 것이다, 그리고 의혹제기가 사회적 비용이 너무 크다라는 것을 강조하고 싶습니다.
4에 대한 반박에 두 가지가 궁금합니다.
첫째로, 미분류표가 되는 기준이 올리신 이미지의 기준과 부합하는가를 전제로 하셨고
그에 대해서 “이런 표들일 것이다.”라고 하셨는데, 실제로 그러한가요?
혹은 글쓴이님의 추정인가요.
둘째로, 17대 대선과 18대 대선의 유효표 판정 기준이 달랐나요?
일단 18대 대선과 17대 대선 모두 기표지 형태는 같습니다.
심지어 17대 대선의 1번은 정동영입니다. 그런데 K값이 1이라는 것은
영상에 나온 세 구에서 17대 대선에 대해서는
개표기 분류에서 1번 프리미엄이 거의 없었다는 말이 됩니다.
그런데 18대 대선에서 세 구 모두 일제히 1.3 이상으로 K값이 증가했습니다.
글쓴이님의 말에 따르면, 17대 대선에서는 미분류표에 1번 프리미엄이 없었는데
18대 대선에서 갑자기 생긴 셈이 됩니다.
그럼 두 가지 가능성이 생깁니다, 개표기의 미분류표 판정 기준이 달라졌거나
혹은 선관위의 유표효 판정 기준이 달라졌거나요, 혹은 둘 다죠.
…
혹시나 유효표 판정 기준이 17대, 18대가 동일하다면 그건 오히려
개표기의 신뢰성이 낮아졌다는 말이 됩니다.
5년전보다 미분류표율이 낮아진 것도 아니고, 유효표 산정 기준도 동일한데
심지어 기존에는 잘 구분하던 것을 5년 후에는 구분을 못한다?
그리고, 혹시 세 구만 보기에 표본이 너무 작다고 하실 수도 있는데
여론조사에서 유의미하다고 간주하고 선정하는 표본집단이 1000명입니다.
그런데 용인시 수지구 한 구에서만 투표 참가자가 14만입니다.
만약 K값이 변동이 없다는 가정 하에서 세 구에서 뽑은 k값이 모두 1.0이 나올 확률은
통계학을 배우셨으니 아실테지만, 1%보다도 적습니다. K값의 분포가 정규분포니까요.
1-100개의 카드 중에서 1만 연달아 3번을 뽑을 확률보다 적습니다.
그런데 그게 또 동시에 일률적으로 증가했습니다.
제가 우리 엄마의 자식이 아닐 확률보다도 낮은 확률이죠.
그렇다면 K값 산정 기준이 달라졌다는거지요. 어떤 이유에서든이요.
그리고 사실 96.4%만 판독가능한 기계라면 인식률이 그렇게 좋은 편은 아닙니다.
한 표 한 표가 소중한 표인데, 심지어 대통령선거의 개표입니다.
전체의 3.6%나 판독 불가능한 기계라면 절대적으로만 봐도 전국적으로
투표용지 2800만표 중 100만표 이상을 구분을 못하는 겁니다.
그런 기계에 대해서, 구분한 96.4%는 알아서 잘 했을 것이다고 믿는 것 자체가
사실 사람이 얼마나 기계를 맹신 하는가를 보여주는거죠.
그리고 사람이 수개표 하는게 힘들다고 하셨는데, 사실 수개표 가능합니다.
애초에 기계에 넣기 전에 표 펴는건 다 사람이 하고 있습니다.
간단한 선거만 해봐도 아시겠지만, 표 펴는것에 비하면 구분하는 시간은 금방입니다.
펴면서 대충 구분한 뒤에 개표기에 넣기만 해도 현재에 비해서 훨씬 정확하죠.
허점을 공격한다는 글이라고 해서 조금 기대하고 봤는데
전반적으로 너무 가정에 기대어 전개되어서 많이 안타까운 마음에 글을 남깁니다.
댓글 감사합니다.
안타까운 마음 들게 한 것은 부족한 제 글실력입니다 (저도 가사와 생업이 있어서 충분히 정리하지 못하고 급하게 썼습니다). 저는 조작이란 주장하는 측에 훨씬 더 큰 설명의무를 부여해야한다고 생각하고, 그에 대한 비판에 대해선 여러 대체가설을 제시하는 것만으로도 충분하다고 생각했습니다.
유/무효표기준은 공직선거법 179조 4항을 보시면 되는데, 여러 차례 개정이 되었습니다. 이런 부분에 쫌 관심이 있어서 18대 대선과 그 전 대선과 기준이 변한 것은 확인할 수 있습니다 (당장 2012년 2월 기준 개정사항도 있습니다). 따라서 17, 16대랑 바로 비교하기 어렵다는 부분을 강조하고 싶습니다. 옛날엔 유효표 판정기준이 훨씬 엄격해서, 선에 걸쳐있어도 상당수가 무효표 처리가 되었습니다. 당연히 K값이 더 1에 수렴하기 쉬었다고 감안할 수 있습니다.
유효표 무효표 판정 기준은 생각하신 게 맞습니다.
제179조(무효투표) ① 다음 각 호의 어느 하나에 해당하는 투표는 무효로 한다.
1. 정규의 투표용지를 사용하지 아니한 것
2. 어느 란에도 표를 하지 아니한 것
3. 2란에 걸쳐서 표를 하거나 2 이상의 란에 표를 한 것
4. 어느 란에 표를 한 것인지 식별할 수 없는 것
5. ㉦표를 하지 아니하고 문자 또는 물형을 기입한 것
6. ㉦표 외에 다른 사항을 기입한 것
7. 선거관리위원회의 기표용구가 아닌 용구로 표를 한 것
② 사전투표 및 거소투표의 경우에는 제1항의 규정에 의하는 외에 다음 각 호의 어느 하나에 해당하는 투표도 이를 무효로 한다.
1. 정규의 회송용 봉투를 사용하지 아니한 것
2. 회송용 봉투가 봉함되지 아니한 것
3. 삭제
4. 삭제
③ 선상투표의 경우에는 제1항에 따라 무효로 하는 경우 외에 다음 각 호의 어느 하나에 해당하는 경우에도 무효로 한다.
1. 선상투표신고서에 기재된 팩시밀리 번호가 아닌 번호를 이용하여 전송되거나 전송한 팩시밀리 번호를 알 수 없는 것
2. 같은 선거인의 투표지가 2회 이상 수신된 경우 정상적으로 수신된 최초의 투표지 외의 것
3. 선거인이나 선장 또는 입회인의 서명이 누락된 것(제158조의3제3항 단서에 따라 입회인을 두지 아니한 경우 입회인의 서명이 누락된 것은 제외한다)
4. 표지부분에 후보자의 성명이나 정당의 명칭 또는 그 성명이나 명칭을 유추할 수 있는 내용이 표시된 것
④ 다음 각 호의 어느 하나에 해당하는 투표는 무효로 하지 아니한다.
1. ㉦표가 일부분 표시되거나 ㉦표안이 메워진 것으로서 선거관리위원회의 기표용구를 사용하여 기표를 한 것이 명확한 것
2. 한 후보자(비례대표국회의원선거 및 비례대표지방의회의원선거에 있어서는 정당을 말한다. 이하 이 항에서 같다)란에만 2 이상 기표된 것
3. 후보자란 외에 추가 기표되었으나 추가 기표된 것이 어느 후보자에게도 기표한 것으로 볼 수 없는 것
4. 삭제
5. 기표한 것이 전사된 것으로서 어느 후보자에게 기표한 것인지가 명확한 것
6. 인육으로 오손되거나 훼손되었으나 정규의 투표용지임이 명백하고 어느 후보자에게 기표한 것인지가 명확한 것
7. 거소투표(선상투표를 포함한다)의 경우 이 법에 규정된 방법외의 다른 방법[인장(무인을 제외한다)의 날인·성명기재 등 누가 투표한 것인지 알 수 있는 것을 제외한다]으로 표를 하였으나 어느 후보자에게 기표한 것인지가 명확한 것
8. 회송용 봉투에 성명 또는 거소가 기재되거나 사인이 날인된 것
9. 거소투표자 또는 선상투표자가 투표 후 선거일의 투표개시 전에 사망한 경우 그 거소투표 또는 선상투표
10. 사전투표소에서 투표한 선거인이 선거일의 투표개시 전에 사망한 경우 해당 선거인의 투표
댓글과 정보 감사합니다.
그럼 시사저널 기자 인터뷰는요??
그건 그냥 미친놈인가요??
죄송합니다. 저는 무슨 인터뷰인지 모르는데 좌표를 찍어주시면 살펴보겠습니다. 아마 이메일이 진짜가 아닌 것 같지만 승인내겠습니다.
요즘 워낙 사람들 관심이 많다 보니 여기 오게 됐는데요. 3:2라고 주장하시는게 1,2,3:5,6을 말씀하시는 건가요? 쓰셨다시피 4도 있고 7도 있고, 뭐 사람들 주장하더만 잉크가 번진 것도 있고 뭐 손을 덜덜 떤 것도 있고 할텐데, 그런 건 비율이 같다 치면, 님의 주장을 다 받아들인다 하더라도 1,2,3,다른거:5,6,다른거 하면 비율은 훨씬 작을텐데요. 제가 뭐 잘못 이해했나요?
댓글 달아주셔서 감사합니다.
넵. 잘 보셨습니다. 본문에도 썼지만, 최대한 단순하게 썼습니다. 제 생각에는 K값이 1이 아니면서도 개표기 조작이 이뤄지지 않았다는 대체가설을 보여주는 것만으로도 충분히 김어준씨의 더플랜 의혹제기의 많은 동인은 사라진다고 생각했습니다. 기타 다른 분들은 지지자들에 따라 기표실수율이 다를 수 있다는 가설로 데이터들을 설명할 수 있다고 말씀하시는 것으로 이해하고, 일리 있다고 생각하고 있습니다. 또한, 좀더 이해를 쉽게 하기 위해 개정된 무효표/유효표 판정규칙때문에 1번과 2번 사이에 얼만큼 유효 면적이 달라질 수 있는지 그림도 추가했습니다.
(아우……….. 진짜 글 엄청 길게 잘 썼는데……. 날려먹네요.)
다시 간략히 써보겠습니다. (다쓰고 보니 또 길어졌네요)
영화는 아주 합리적인 의심을 담고 있습니다. 저라도 의심할 것 같은 상황이죠.
1. 1.5라는 수
2. 시간역전 현상
1. 저도 나름 관련지식을 갖춘 입장에서, T분포 검정을 이용해 대략 끄적여봐도 20~40시그마가 나옵니다. 전 살면서 본적도 없는 확률이네요. 번개가 2번이라고 말하는 건 참 약한 표현입니다. (한 5번은 맞아야 될 거 같은데요…)
대략 그 수치를 감잡자면… 999개의 검은색 구슬과 1개의 흰색 구슬이 담긴 상자에서 그 단 하나의 흰색 구슬을 수십번을 연속해서 뽑을 확률? 그냥 불가능합니다.
2. 사실 이 부분은 약간 개연성이 부족합니다. 영화 초반에는 시간역전현상으로 주목을 끌지만, 정작 영화 내내 ‘시간역전현상과는 무관한’ 개표기의 해킹 취약성을 문제 삼습니다. 시간역전현상과 관련된 내용이라곤 중앙서버를 해킹할 경우 광범위한 해킹이 가능하다 정도?
영화는 아주 적절한 의심들을 잘 나열하고 있습니다. 다만 나열 뿐입니다.
그 의심들간의 연계성이 빈약합니다. 그게 아쉬웠습니다.
(하지만 아쉬운 것은 아쉬운 거고) 영화를 보고나서, 저는 영화를 잘 만들어준 김어준씨와 다른 영화 관계자들에게 큰 박수를 보냈습니다. 영화는 분명히 합리적인 의심들을 담고 있었고,그에 대해 답을 구할 순 없었지만, 최선을 다해 퍼즐을 짜맞추려는 노력의 흔적이 보였습니다. 그래서 어제 저는 영화를 보고 ‘분명히 18대 선거는 조작이 있었구나!’라고 믿게 되었습니다.
그리고 오늘, 인터넷에서 그영화에 대한 몇몇 반박을 보고.. 헛소리로 치부해 버릴 때 쯤, 이글을 읽게 되었습니다. 여전히 제 자세는 ‘흥 이건 또 무슨글이야?’ 였습니다. 그리고 처음 대충 읽고 나서도 ‘뭐라는 거야?’ 였습니다. 하지만, 다시 한번 더 정확히 읽어보니 상당히 합리적인 내용들입니다. 사실 영화에 대한 아주 깔끔한 반박입니다.
변의 수가 1.5배의 차이를 만들었다?
처음 들었을 때 궤변도 가지가지다. 라고 생각했지만. 곰곰이 생각해 보면 충분히 그럴 수 있다는 사실에 새롭게 문제를 바라보게 됩니다. 단 단서가 붙죠.
지난 16,17대 대선은 기표의 범위가 넓은쪽으로 자동 분류했던 반면, 18대 대선은 기표가 조금이라도 걸치면 무효표로 처리했다. 는 단서입니다.
(저는 귀찮아서 그 단서가 맞는지 모르겠고 찾아볼… 생각은 죄송하지만 없네요.)
하지만 글쓴이가 말하는 근거가 사실이라면… 이 내용을 통해 ‘18대 대선은 조작이다!’ 라는 의혹은 저도 거두고 싶네요. 아주 좋은 반박입니다. 가장 중요한 의심을 한방에 해결해 주는 통찰력이네요. (다만 그래도 그렇지… 여전히 미분류표 3%는 의심을 불러일으킬만한 엄청 높은 수치입니다.)
또 시간역전 문제도 있으나, 그건 ‘현장기자들의 카운트가 빠르기 때문이다’라는 답변도 충분히 설득력 있습니다.
어쨌든 어제는 영화를 보고 엄청 안타까움을 느꼈으나, 오늘 이글을 보니 문제를 다시 생각해보게 만드네요.
하지만 그렇다고 영화자체를 선동영화일 뿐이다. 라고 말하는 건 좀 안타깝습니다. 분명 이영화를 통해, 1. 평소에 개표 시스템에 관심이 없던 (저같은) 사람들에게 개표시스템을 좀 더 잘 알게 해주었으며, 2. 분명한 개표기계의 해킹 취약성을 발견했습니다.
그것만으로도 이 영화는 아주 좋은 영화 같습니다.
음모론으로 치부해 버릴 것들은 1. 합리적이지 않은 의심이거나. 2. 말뿐인 의심입니다. 하지만 이 영화는 분명히 합리적인 의심을 담고 있고, 의심을 증명하기 위해 많은 노력을 담았습니다. 이영화를 보지도 않고 ‘응~음모론이야~’라고 말하는 건 아닌 것 같습니다. 그 점을 분명히 칭찬하고 싶네요. 그리고 수년에 걸친 의혹제기를 깔끔하게 반박한 이글에는 감탄하고 갑니다. (물론 제가 이 쪽에 관심이 없어서 이 글의 내용이 이미 공공연한 반박이었다면… 제가 더 관심을 가져야겠네요 하하)
감사합니다.
여러가지 가설들이 가능하다고 생각하고, 이런 문제제기를 할 땐 신중하게 하면서 살펴봐야한다고 생각합니다. 김어준씨에 대해선 죄송하지만 (제가 과학자여서) 과거 황우석씨에 대해서 음모론 기법을 이용해서 끝까지 옹호했던 기억이 있어서 쫌 편향이 있을 수 있습니다.
그리고 노파심에, 이런 대체가설 말고도, K값이 1이 안 나올 가설들이 있습니다. 지지자들의 기표실수하는 확률에 차이가 난다는 가설인데요, 일리 있다고 생각하고 제가 제시한 가설과 이율배반적이라고 생각하지 않습니다. 참고해주셨으면 합니다.
그러니까 시간역전의 이유가 부지런한 기자들의 설레발 때문이라는거죠?
공표하기도 전에? 그런 기자들을 우습게 보지 말라구요? ㅋㅋㅋㅋ 제 메일 주소는 XXXXX 입니다.
댓글 달아주셔서 감사합니다. 혹시 개인정보가 공개될까봐 (입력하신 이메일은 확인했습니다) 지웠습니다.
이 점에 대해선 여러가지 합리적인 설명이 가능하단 취지였고, 그럼에도 남는 투표함의 수로는 당락을 바뀔만큼 큰 차이는 아니라는 입장입니다.
그러니까 생기는 의문은 왜 그 기호1번에 대한 1.5 어드밴티지가 17대 16대 대선에선 보이지 않았냐는 거죠. 물론 남아있는 샘플이 선거구 3개에 불과하고 전체를 대변하기엔 많이 부족하다는 타당한 의견도 있지만, 그럼에도 불구하고 명확하게 1로 수렴하던 16대 17대 대선 데이타와, 역시 1.5에 수렴하는 18대 대선 데이타와의 차이가 합리적인 의심을 할 수 있게 하기에는 충분하지 않을까요? 단순히 A후보를 찍을 수 있는 스팟이 B후보에 비해 한군데가 더 많기 때문에 3/2=1.5의 어드밴티지를 갖는다 땅땅 하고 결론 내리기엔 생각해보아야할게 너무 많습니다. 아닌 말로 단순히 걸러지는 미분류표중 1-7 스팟의 비율이 정확히 1:1:1:1:1:1:1 이라면 1.5의 결과가 잘 튀어나오는데요. 과연 미분류표로 떨어진 표들의 1-7스팟 적중 비율이 저렇게 기계적으로 1:1:1:1:1:1:1로 딱 떨어질까요? 이 부분이야말로 의심을 해봐야 하는 부분이라고 생각합니다.
댓글 감사합니다.
여러가지 이유가 있지만, 제 본문이 제대로 강조하지 않았던 것 같은데, 무효표와 유효표를 판정하는 기준 자체가 각 대선마다 달라졌습니다. 16, 17대 대선 땐 무효표가 훨씬 많았습니다. 왜냐하면 경계선에 걸려있는 것도 막 무효표로 삼고 그랬으니까요 (그러면 1번 프리미엄이 사라집니다). 공직선거법 179조 4항 변경일자들을 확인해주시면 감사하겠습니다.
을 본 뒤 이 글을 읽으면서 머릿속이 복잡해집니다.
글을 읽으면서 주장의 완결성이 부족하다고 느끼게 되었습니다.
다 읽고도 ‘완결성 부족’ 정도밖에 느끼지 못한 것은
반박의 완결성도 부족하다고 느껴서이지 않을까 합니다.
영상을 한 번밖에 보지 않았지만 내용은 충분히 기억한다고 여기기에,
반박의 반박 질문을 드리고 싶은데 답변해주실 수 있으신지요?
(물론 아직도 쪽의 이야기에 더 설득력이 있다고 여기는 상태라
옹호하는 형태로 질문이 흐를 수 있다는 점 양해 부탁드립니다.)
0.5 형식
먼저 0.5 형식 가운데 전자개표기와 전자투표기 부분입니다.
전자투표기와 전자개표기를 섞어 쓰는 방식에 대해 제가 느낀 건
완전 전자방식으로 갈수록 조작이 쉬워질 수 있다는 경고 정도였습니다.
우리나라의 사례에 해당하지 않는 전자투표기의 등장이
전체 흐름과 상관이 없다고 여길 여지도 많지요.
어쩌면 지적해주신 것처럼 인지편향에 따른 결과일 수도 있겠습니다.
(저도 0.5 형식처럼 가볍게 다루겠습니다.)
두 번째는 전자개표기 이후 수개표에 대한 부분입니다.
수개표가 이뤄진다는 부분을 축소했다는 걸 지적하셨는데,
저는 충분히 나왔다고 봤거든요.
물론 ‘시연’ 과정에서 나오지 않은 부분에서의 이야기라면 응당 옳은 말씀입니다.
그런데 ‘수개표’ 과정에서 많은 용지를 빠르게 세기 위해
수날림하는 장면이 수 차례 나옵니다.
저는 오히려 그 부분이 더 충격적이던데요.
여러 사람이 중복검수하기에 소홀해질 수 있다거나
인지심리상 다수의 용지에서 지나가는 이형을 잡아내지 못할 수 있다는
짐작에 가까운 이야기는 빼놓더라도,
수개표가 ‘수개표’로 제대로 이뤄지지 않는다는 점은 분명해 보입니다.
선관위에 게재된 수개표 소요시간을 보면
수날림마저도 날림으로 한 게 아닐까 싶긴 합니다.
외국인 전문가 활용 부분은 적지 않으시는 게 낫지 않았을까 합니다.
“미국학자들이 한국의 투표시스템에 대해서 알겠는가?”라는 인식이 걱정스러웠습니다.
제작진이 투표시스템의 차이에 대해 확실히 알려주지 않았으면 맞는 말,
알려줬다면 틀린 말이 되니까요.
시연 부분 검표 감성팔이 관련해서 공감합니다.
1. 작은 의혹들
역누적 부분에 대한 지적은 충분히 옳은 판단이라고 생각합니다.
그런데 발췌를 통해 시간역순의 오류를 지적하신 부분에서는
여러 가지가 잘못되어 있다고 봅니다.
기자의 취재행태가 관행적이더라도
선거관리 지침에서 선거관리위원장이 확인한 뒤에 언론에 전달하게 되어 있는데,
그게 당연하다거나 자연스럽다고 말할 수 있나요?
참관할 수 있으므로 현황판을 본다고 쳐도
수를 센다는 건 현황판의 수를 계산하는 정도지 직접 표를 검수하는 건 아닌데
어떻게 카운팅 중에 숫자가 나올 수 있는 건가요?
이건 제가 잘 몰라서 하는 얘기인데, 그 많은 개표소에는
각 언론사 기자(임시 특파원)가 모두 파견된다는 얘기인가요?
그리고 보다 근본적인 문제.
아직 투표함이 개표소에 도착하지 않았는데 발표된 숫자는 도대체 뭘까요?
기자(임시 특파원)가 이동하는 차량에 탑승해서 먼제 세는 건 아닐 텐데요.
2. 개표기
‘(6)은 소설이다.’라는 부분은 영상만으로는 판단하면 옳습니다.
문제는
이 부분에 대한 지적은 이 영상이 등장하기 전에도 무척 많이 나와서
또 나올 필요가 있었을까 하는 점입니다.
이미 사회적으로 공론화된 내용이기 때문에 나오지 않은 게 아닐까 하는 건데요.
물론 수치가 등장한 건 아닙니다만,
아무 마킹도 하지 않은 표가 혼입되거나
두 후보의 칸 경계에 반반 걸쳐 찍은 무효표가 혼입된 경우,
심지어는 다른 후보의 칸에 마킹한 표가 혼입된 경우가 있지 않았습니까?
‘1번이 유리한 18대 대선 투표지’에 대해서는 그럴 수 있겠다고 생각했습니다.
3. 당락
전체 득표수의 3%에 대한 환산치 부분에서는
오히려 에서 제시한 ‘혼입’ 가능성(대체가설)을
논외로 했기 때문에 등장한 수가 아닌지요?
4 이후
글쓴이의 의견이어서 특별히 거론하기 어렵거나,
여쭙고 싶은 부분이 마땅히 있는 게 아니어서 넘어갑니다.
괜찮으시면 의견을 알려주시면 좋겠습니다.
긴 댓글 감사합니다.
제가 가사와 생업에 바쁜 사람이고, 정말 그냥 간단하게 쓴다는게 이런 높은 반응을 보일줄 몰랐습니다. 그래서 완결성이 부족하단 부분은 제 부족함으로 인정합니다. 조금 다른 시각을 갖고 좀더 차분하게 더플랜에 대해서 생각하게 되었다면 그것만으로도 충분합니다. 시간이 되면 다듬고 싶은데 어떨지 모르겠습니다.
저는 솔직히 시간이 빨랐다는 것을 영상에서 근거를 못 찾아서 답답했습니다. 이건 김어준씨의 말을 믿어야하는데 뭐라고 답하기 어렵습니다. 개표기가 잘못 동작한 사례에 대해서 좌표를 알려주시면 좀더 살펴보겠습니다. 해당 사항에 대해 더플랜 이전에 관심을 가져보지 않아서 못 따라가고 있습니다.
혼입가설을 논외로 해서 계산했는데, 혼입가설은 아예 논리적으로 근거가 없다고 판단했기때문입니다 (그냥 막 만들었다고 하면 무슨 얘길 할까요). 다만 모든 100표 묶음에 1표씩 묶였다고 하더라도 swing은 대충 1-2%일텐데, 안타깝게도 두 후보 사이의 득표율차가 더 크기도 합니다. 급하게 댓글 달은 것 이해해주셨으면 합니다 (지금도 너무 댓글들 많아 힘드네요 ㅠ.ㅠ)
혹시 7번에 찍히면 2번 후보에게 카운트 해주진 않았나요? 3번후보가 사퇴했기에 궁금합니다.
댓글 감사합니다. 이건 아니라고 이해하고 있는데, 실제 판정집계부에서 판단하신 분들의 증언(?)이나 선관위의 룰을 확인해야할 것 같습니다. 노파심에, 저는 대체가설 하나를 말씀드린거고, 다른 식으로 K값을 설명하는 분들도 많습니다 (지지자들 사이의 기표오류율이 다름). 일리 있다고 생각하고 제가 제시한 가설과 이율배반적이지 않다고 생각합니다.
저기 유효표의 예라는 것이, 선관위가 유효로 인정을 하는 기준을 알려주는 것이고, 기계가 저런 기표를 유효로 분류해낸다는 것은 아닐 것 같은데요….혹시 확인이 가능할까요
아… 미분류중에 기호 1로 인정될 확률이 높다는 거니깐 이건 관계가 없겠네요ㅎ
댓글 감사합니다.
ㅎㅎ 누구나 보고 싶은 것만 보죠.
이 정도면 망상이 아닌가 싶긴 해도 지적 해봅니다.
위의 가정이 사실이라고 치면, 현재의 투표 방식이 너무 어려운거네요.
정확하게 네모 칸에 도장을 찍지 못하는 인구가 3%나 된다니 말입니다.
이번 대선만 수전증을 가진 사람들이 늘어난건 가요?
아니면, 기표지의 후보자간 공간을 두지 않는 것 만으로 이런 편향을 만들 수 있다고 보는 건가요?
그리고 그런 편향은 있을 수도 있는 일이다??
만약 선관위에서 이런 설명을 한다면 풀스윙으로 귀싸대기를 갈기고 싶네요.
댓글 감사합니다.
저는 귀싸대기 때리지 않으셨으면 합니다. 다행히 아직 망상증 환자는 아닌 것 같습니다. 세상에는 생각보다 자신과 다른 사람들이 많은 것 같습니다. 충분히 말이 안 된다는 분들의 말씀도 이해가 가지만, 저는 다른 근거들이 제시되지 않는 이상, 선관위가 보여준 수치들에서 엄청난 이상점을 느끼지 못했습니다. 제가 보고 싶은 것만 보는 것처럼 푸른바다님도 보고 싶은 것만 보는 것이 아닌지 조심스럽게 되물어봅니다.
전적으로 동감합니다.
다만 글중 이부분을 좀더 확인하고 싶네요.
” 앞서 18대 대선땐 무조건 줄에 걸쳐있기만해도 판별한다고 했는데, 아주 옛날엔 그 줄에서 기표의 넓이가 넓은쪽에다가 유효표를 줬다. ”
17대/18대 대선때 유효표 판정이 달라졌음을 공식적으로 확인할수 있는 곳이 있고 그 부분이 이 글에 추가된다면 정말 반박 불가하다고 생각됩니다.
그리고 저는 영화를 보면서 1.5의 정규분포를 이룬다는것.
그것 자체가 오히려 이상하더라구요. 조작으로 정규분포를 자연스럽게 만들려면 얼마나 정교하게 했다는거야??? 라는 생각이 들었죠.
네 저도 정규분포를 이뤘다는거에 오히려 좀더 결과 안정성에 좀더 신뢰가 갔습니다.
무효표룰 확인하시고자 하는 부분은 제 기억에 의존하고 있고(“달라진 무효표 판정 기준~” 이래서 기사를 본 기억이 납니다), 공선법 179조 4항에서 2012년 등 개정사례가 있는데, 저도 제 개인시간이 나는대로 좀더 찾아보고 있습니다. 무효표룰이 전혀 안 바뀌었다고 한다면, 위태로운 가설이란 점은 십분 인정합니다. 그렇다고 하더라도 다른 분들이 제시하는 지지자별 기표실수율이 다르다는 등 여러 대체 가설들이 제시되었고 일리 있다고 생각합니다.
권해명의 멘붕의 시대에 진실이 있죠.
문빠 김어준이 제작한 더 플랜은 문재인 쉴드치기용
죄송하지만 무슨 말씀인지 이해가 안 갔습니다. 더 자세히 알려주시면 생각해보겠습니다. 감사합니다.
더플랜 보고 난 후 영화에대한 반응이나 반론을 없을까하고 타고타고 선생님 글을 읽었습니다. 합리적인 반론이고, 고개가 끄덕여집니다. 저는 수학이나 통계를 모르는데요.
그래도, 선생님의 말씀의 핵심은 당시 대선에서는 1번 프리미엄때문에 미분류표가 1번에게 유리할수밖에 없다. 그래서 k값이 설명이 된다.
근데. 개인적으로 궁금한게, 그럼 호남의 경우인데요. 문재인에 몰표가 갔을거고, 노인층에서도 문재인의 표가 압도적인데도 k값이 1번에 많이 나올수있는가요? 미분류중에 1번프리미엄이 작용해도 그걸 넘을만큼 노인층의2번 미분류표가 많았을거라보는데, 선생님 생각은 어떤지요.
제가 수학을 잘 모르니, 쉽게 설명 부탁드립니다.^^;;;
개표부정관련 의혹제기는 파파아이스에서 여러번 다뤘었는데, 김어준씨가 청취자에게 의견달라했었거든요. 그때 선생님의 이런 의견이 더플랜 제작전에 미리 전해졌더라면 좋았을텐데 아쉽습니다.
여튼, 더플랜이 헛다리 짚는 의혹제기일지라도, 해킹을 통해 쉽게 조작이 가능하다는것을 인지하게되었습니다. 또 수구세력들의 파렴치한 조작과 공작질이 존재했기때문에, 이러한 의심과 의혹을 자유롭게 말할수있는 용기있는 사람은 있어야할것이고, 토론과반론을 통해 걸러내면 되는거 아닌가 싶습니다.
K값은 해당 개표지역의 두 후보의 지지율을 보정해서 나온 값입니다. 하여 그 부분은 문제가 없을 것 같습니다.
저는 더플랜이 거의 나오기 직전에서야 이것 갖고 아직도 의혹제기하는 분들이 있다는 것을 처음 알았습니다. 미리 알았다면 일말의 희망으로 보내봤을지도 모르겠습니다.
개표기가 설사 조작이 가능하다고 하더라도, 현재 선관위가 짜여진 시스템은 대규모 부정을 이루기 쉽지 않고 그런 근거를 더플랜에선 확인하지 못했습니다. 안타깝게도 MB나 탄핵당한 전 대통령이 하도 나라를 엉망으로 만들어놔서 이런 의혹마저 나올 토양이 생겼다는데에 마음이 아픕니다.