ฉัตริน จันทร์หอม ผู้สมัคร สส. แบบบัญชีรายชื่อ พรรคเพื่อไทย ระบุผ่านสื่อโซเชียลมีเดีย วันนี้ (21 กุมภาพันธ์ 2569) ว่า เลือกตั้ง 2569 : ข้อมูลพูดอะไร เขตไหนน่าสงสัย ใครได้ประโยชน์ หลังจากที่ กกต. ประกาศผลการเลือกตั้งอย่างเป็นทางการเมื่อ 2 วันก่อน ก็มีกระแสออกมาว่าทำไม ไม่ออกมากเป็นแบบ Excel ที่คนใช้ run data ตรวจสอบได้
เมื่อเช้านี้มีพลเมืองดี (คุณชานนท์ เงินทองดี @KillerNay) ที่ใช้ OCR สแกน PDF แบบฟอร์ม สส.6/1 ของ กกต. แล้วทำ database บน Github (https://github.com/killernay/election-69-OCR-result) ให้คนอย่างผมมาปั่นเล่นดู
Disclaimer: นี่ไม่ใช่ความเห็น ไม่ใช่การกล่าวหา แต่เป็นตัวเลขล้วนๆ ตามหลักคณิตศาสตร์ แต่ตัวเลขอาจจะยังคลาดเลื่อนในบางเขต เนื่องจากใช้ OCR สแกนมาจากกระดาษ (คุณชานนท์เองก็ยังแก้ข้อมูลอยู่เรื่อยๆ) แต่ก็พอให้เห็น Trend กว้างๆ บางอย่างได้
ข้อค้นพบแต่ละหัวข้อ
1. บัตรเขย่ง — "คนมาลงคะแนน" กับ "บัตรในหีบ" ไม่ตรงกัน ตามหลักการ : คนมา 1 คน = บัตร 1 ใบ ตัวเลขสองตัวนี้ต้องเท่ากันเสมอ
แต่ในข้อมูล:
• บัตรแบ่งเขต: พบ 18 จาก 387 เขต ที่ตัวเลขไม่ตรง รวมส่วนต่าง 37,389 ใบ
• บัตรบัญชีรายชื่อ: พบ 25 เขต รวมส่วนต่าง 56,664 ใบ
2. ตัวเลขภายในไม่ลงตัว — บัตรหายไปไหน?
บัตรทุกใบที่หย่อนลงหีบต้องถูกจัดเป็น "บัตรดี" + "บัตรเสีย" + "ไม่ประสงค์ลงคะแนน" ถ้าบวกแล้วไม่เท่ากับบัตรที่ใช้ แปลว่ามีบัตรหายหรือนับซ้ำ
• บัตรแบ่งเขต: 34 เขต มีตัวเลขไม่ตรง รวมส่วนต่าง 50,771
• บัตรบัญชีรายชื่อ: 76 เขต รวมส่วนต่าง 69,802
3. กรณีที่เป็นไปไม่ได้ทางคณิตศาสตร์
ที่จริงบัตรดีต้องไม่มากกว่าบัตรที่ใช้ (จะมีคะแนนดีมากกว่าบัตรที่หย่อนลงหีบไม่ได้) และบัตรที่ใช้ต้องไม่มากกว่าจำนวนคนที่มาลงคะแนน พบถึง 24 กรณีที่มีส่วนต่างนี้เกิน 100
4. บัตรสองใบไม่ตรงกัน — คนกลุ่มเดียวกัน ตัวเลขต่างกัน
ผู้ลงคะแนนทุกคนได้รับบัตร 2 ใบพร้อมกัน: บัตรแบ่งเขตและบัตรบัญชีรายชื่อ จำนวนผู้มาใช้สิทธิจึงต้องเท่ากัน
แต่: 98 จาก 384 เขต (25.5%) มีจำนวนผู้มาใช้สิทธิต่างกันระหว่างสองบัตร
ยอดส่วนต่างสัมบูรณ์รวม: 25,796 คน
จำนวนบัตรที่ใช้ก็ต่างกัน 109 เขต รวม 24,137 ใบ
5. บัตรเสีย — สูงกว่ามาตรฐานสากล
อัตราบัตรเสีย:
• แบ่งเขต: 3.55%
• บัญชีรายชื่อ: 4.43%
เทียบกับประเทศอื่น:
• สหราชอาณาจักร: ~0.3%
• แคนาดา: ~0.8%
• เยอรมนี: ~1.0%
• ญี่ปุ่น: ~1.8%
• อินโดนีเซีย: ~2.5%
6. บัตรเสียมากกว่าคะแนนนำ
พบ 37 เขต ที่จำนวนบัตรเสียอย่างเดียว มากกว่าคะแนนที่ผู้ชนะนำอยู่
จำแนกตามพรรคผู้ชนะใน 37 เขต:
• ภูมิใจไทย — 10 เขต
• กล้าธรรม — 9 เขต
• เพื่อไทย — 8 เขต
• ประชาชน — 8 เขต
• ประชาธิปัตย์ — 1 เขต
• ไทรวมพลัง — 1 เขต
กระจายทุกพรรค ไม่กระจุกที่พรรคใดพรรคเดียว
แต่ในมาตรฐานการสังเกตการณ์เลือกตั้งระหว่างประเทศ (OSCE/ODIHR, EU EOM) เมื่อบัตรเสียเกินคะแนนนำ ถือเป็น red flag ที่ต้องตรวจสอบเพิ่มเติม
7. บัตรเสียสูงในเขตไหน?
อัตราบัตรเสียเฉลี่ยจำแนกตามภาค:
• กทม. — 1.66% (ต่ำสุด)
• ใต้ — 2.91%
• กลาง — 3.34%
• ตะวันออก — 3.70%
• อีสาน — 3.74%
• เหนือ — 4.82% (สูงสุด)
ภาคเหนือมีบัตรเสียมากกว่ากทม. เกือบ 3 เท่า ช่องว่างนี้ใหญ่ผิดปกติสำหรับประเทศเดียวกัน
8. ระบบบัญชีบัตร: บัตรที่ได้รับ − บัตรที่ใช้ ≠ บัตรที่เหลือ
ตามหลัก: บัตรที่ได้รับมา − บัตรที่ใช้ = บัตรที่เหลือ
พบ 37 กรณีที่สมการนี้ไม่ตรง
9. สถิติ Benford's Law
กฎของเบนฟอร์ดบอกว่าในข้อมูลที่เกิดขึ้นตามธรรมชาติ (ไม่ใข่คนเขียนขึ้นมาลอยๆ) ตัวเลขหลักแรกจะไม่กระจายเท่ากัน เลข 1 ควรปรากฏ ~30% ไปจนถึงเลข 9 ~4.6%
• คะแนนแบ่งเขต: ค่าไคสแควร์ 31.20 — มีนัยสำคัญทางสถิติ
• คะแนนบัญชีรายชื่อ: ค่าไคสแควร์ 85.05 — มีนัยสำคัญทางสถิติ
• ตัวเลขหลักที่สอง: ค่าไคสแควร์ 10.08 — ปกติ
แต่ต้องระวัง: นักวิชาการจาก Cambridge (Deckert et al., 2011) สรุปว่ากฎของเบนฟอร์ด "ไม่เหมาะเป็นเครื่องมือตรวจจับทุจริตเลือกตั้ง" เพราะให้ผลบวกลวงสูง ใช้เป็นตัวชี้วัดเดียวไม่ได้
สิ่งที่น่าสนใจกว่า: เลขสองหลักสุดท้ายไม่กระจายสม่ำเสมอ (ค่าไคสแควร์ 219.28 สูงกว่าค่าวิกฤตมาก) เลข 05 พบบ่อยที่สุด (1.33 เท่าของค่าคาดหมาย) ส่วนเลข 97 พบน้อยที่สุด (0.67 เท่า) แต่เช่นกัน อาจเกิดจากโครงสร้างข้อมูล ไม่ใช่การแทรกแซง
10. อัตราการมาใช้สิทธิที่ผิดปกติ
ค่าเฉลี่ยทั้งประเทศ: 71.60% (ส่วนเบี่ยงเบนมาตรฐาน 5.66%)
เขตที่สูง/ต่ำผิดปกติ (ค่า Z เกิน ±2):
• ชลบุรี เขต 9 — 56.36% (ต่ำผิดปกติ)
• ราชบุรี เขต 5 — 85.73% (สูงผิดปกติ)
ไม่มีพรรคใดแสดงรูปแบบที่น่าสงสัยระหว่างอัตราการมาใช้สิทธิกับคะแนนนำ (ค่า r อยู่ระหว่าง -0.185 ถึง +0.224 สำหรับพรรคใหญ่ ซึ่งถือว่าโอเค)
11. ฐานเสียงพรรค — ใครสม่ำเสมอ ใครกระจุกตัว?
ค่า CV (Coefficient of Variation) ยิ่งต่ำ = ฐานเสียงยิ่งกระจายทั่วประเทศ:
บัตรแบ่งเขต:
• ประชาชน — CV 50.7% (สม่ำเสมอที่สุด)
• ภูมิใจไทย — CV 69.1%
• เพื่อไทย — CV 85.1%
• กล้าธรรม — CV 120.1%
• ประชาธิปัตย์ — CV 155.7% (กระจุกตัวมากสุด)
กล้าธรรม น่าสนใจ: คะแนนเขตเฉลี่ย 13.64% แต่คะแนนบัญชีรายชื่อเฉลี่ยแค่ 1.74% สะท้อนว่าคะแนนมาจากตัวบุคคลมากกว่าแบรนด์พรรค
12. ยอดรวมระดับประเทศ (384 เขตที่มีข้อมูลครบ)
ส่วนต่างสุทธิผู้มาใช้สิทธิ (แบ่งเขต − บัญชีรายชื่อ): +24,608 คน
ส่วนต่างสัมบูรณ์รวม: 25,796 คน
บัตรเสียบัญชีรายชื่อมากกว่าแบ่งเขต: 320,968 ใบ
ไม่ประสงค์ลงคะแนน แบ่งเขตมากกว่า: 475,367 ใบ
อันนี้ก็น่าแปลกใจพอสมควร
แล้วทั้งหมดนี้กระทบผลเลือกตั้งมากน้อยแค่ไหน?
จำนวนเขตที่: ข้อมูลมีปัญหา + บัตรเสียสูงผิดปกติ (เกินค่าเฉลี่ยประเทศ) รวมกันเกินคะแนนนำ มีอยู่ด้วยกัน 12 เขต
จำแนกตามพรรค (12 เขตรวม):
• กล้าธรรม — 4 เขต
• ภูมิใจไทย — 3 เขต
• เพื่อไทย — 3 เขต
• ประชาชน — 2 เขต
ถือว่ากระจายทุกพรรค ไม่ได้กระจุกอยู่ที่พรรคใดพรรคเดียว
ข้อควรระวัง — อ่านก่อนแชร์
1. ข้อมูลนี้มาจาก OCR ไม่ใช่ข้อมูลดิจิทัลจาก กกต. โดยตรง ส่วนต่างเล็กๆ (1-10) อาจเกิดจาก OCR อ่านผิดได้ แต่ส่วนต่างหลักพันหลักหมื่น อธิบายด้วย OCR ไม่ได้
2. "ความผิดปกติ" ≠ "ทุจริต" อาจเกิดจาก (1) เจ้าหน้าที่บันทึกผิด (2) OCR อ่านผิด (3) ปัญหาจริงในกระบวนการนับ ข้อมูลบอกว่า "มีอะไรไม่ตรง" แต่บอกไม่ได้ว่า "ทำไม"
3. "ผลอาจได้รับผลกระทบ" ≠ "ผลผิดพลาด" การที่ยอดความเบี่ยงเบนเกินคะแนนนำ ไม่ได้หมายความว่าผู้ชนะต้องเปลี่ยน แค่หมายความว่าข้อมูลชุดนี้ไม่สามารถใช้ยืนยันผลได้อย่างมั่นใจ
สรุป
ไม่ว่าจะมองจากมุมไหน ตัวเลขเหล่านี้บอกสิ่งเดียวกัน: ข้อมูลจากแบบฟอร์มทางการของ กกต. เองมีจุดที่ "ไม่ลงตัว" หลายข้อ ทั้งภายในแบบฟอร์มเดียวกันและระหว่างสองบัตร สิ่งที่ต้องเกิดขึ้นคือ กกต. เปิดข้อมูลดิจิทัลให้ตรวจสอบ ไม่ใช่ให้ประชาชนต้องมา OCR เอกสารสแกนเอง ถ้ามีข้อมูลทางการแบบดิจิทัลจาก กกต. แล้วผมจะมา run number ให้ใหม่ครับ