Những ngày qua, người dân cả nước bất ngờ vì điểm số THPT quốc gia của tỉnh Hà Giang quá cao: cả nước chỉ có 76 thí sinh có điểm thi khối A1 đạt từ 27 điểm trở lên thì Hà Giang có đến 36 thí sinh đạt mức điểm này, chiếm 47,37%…

Trên mạng xã hội, giới học thuật lan truyền bài phân tích của một giáo sư Úc gốc Việt dùng các phép kiểm thống kê, từ đó kết luận điểm thi của tỉnh Hà Giang là “không bình thường”. Chúng tôi xin phép thuật lại bài phân tích của giáo sư.

“Ai cũng thấy điểm thi ở tỉnh này có vẻ bất thường, nhưng chưa hình như chưa ai phân tích vấn đề cụ thể bằng số liệu thực tế. Cái note này sẽ trình bày phân bố điểm thi THPT của tỉnh Hà Giang.

Đặt vấn đề

Một bạn đọc chuyển cho tôi một file rất có ích. Đó là bộ dữ liệu về điểm thi CỦA MỖI THÍ SINH cho mỗi môn thi trên cả nước và tỉnh Hà Giang. Dung lượng data lên đến 50 MB. Rất quí. Dựa vào dữ liệu này, tôi có thể phân tích vấn đề cụ thể hơn. Câu hỏi đặt ra là phân bố điểm thi của thí sinh Hà Giang có khác biệt một cách đáng chú ý so với phân bố của cả nước? Cách trả lời câu hỏi này rất đơn giản bằng thống kê học mà tôi có thể mô tả như sau:

Điểm thi của thí sinh Hà Giang có khác biệt một cách đáng chú ý so với phân bố của cả nước?

Phương pháp nghiên cứu

Hình 1: Phân bố điểm thi của cả nước và tỉnh Hà Giang

Bước 1: Tìm phân bố của cả nước. Nói cách khác, chúng ta đếm số thí sinh có điểm 0, 0.2, 0.4, 0.6, …, 10. Cột 2 của hình 1 thể hiện kết quả đó.

Bước 2: Tìm phân bố của Hà Giang. Chúng ta đếm số thí sinh có điểm 0, 0.2, 0.4, 0.6, …, 10. Hà Giang có 3203 thí sinh. Cột 3 của 1 thể hiện kết quả cho Hà Giang.

Buớc 3: Tính giá trị kì vọng cho Hà Giang. Chúng ta hỏi: nếu phân bố điểm thi của cả nước (bước 1) áp dụng cho Hà Giang thì có bao nhiêu em có điểm 0, 0.2, 0.4, 0.6, …, 10. Tạm gọi đây là điểm kì vọng. Kết quả được trình bày trong cột 4 của hình 1.

Bước 4: Ở mỗi điểm, lấy số thí sinh Hà Giang thực tế đạt được trừ cho số [kì vọng] thí sinh mà nếu phân bố của cả nước. Cột 5 (hình 1) trình bày kết quả này.

Bàn Luận Kết Quả

Dĩ nhiên, nếu phân bố điểm thi của Hà Giang tương đương với phân bố của cả nước, thì cột thứ 5 sẽ gần bằng 0. Nhưng chúng ta thấy trong thực tế thì không phải vậy:

• Ở điểm thấp (từ 1 đến 3.6), số thí sinh Hà Giang cao hơn so với giá trị kì vọng.

• Nhưng ở điểm cao hơn (từ 4.0 đến 7.8) thì số thí sinh Hà Giang thấp hơn giá trị kì vọng của cả nước.

• Nhưng điều thú vị nhất là ở điểm cao ‘top’ (từ 8.6 đến 9.6) số thí sinh Hà Giang cao hơn so với phân bố cả nước. Nếu theo xu hướng của cả nước, Hà Giang chỉ có 7 thí sinh ở ngưỡng điểm 8.6 đến 9.6, nhưng trong thực tế con số thí sinh đạt điểm này là 72, tức cao gấp ~10 lần so với cả nước!

Ở điểm cao ‘top’ (từ 8.6 đến 9.6) số thí sinh Hà Giang cao hơn so với phân bố cả nước

Một cách khác để hình dung sự khác biệt về phân bố của điểm thi là vẽ biểu đồ phân bố (Hình 2). Biểu đồ dưới đây cho thấy phân bố điểm của Hà Giang (màu hồng) và của cả nước (màu xanh). Chúng ta thấy điểm trung vị của Hà Giang là khoảng 3.2, so với 5.0 của cả nước. Chú ý sự bất thường của Hà Giang ở điểm 8 đến 10 nó “nhô lên” trong khi đáng lí ra phải thấp dần như cả nước. Xu hướng này cũng nhất quán với kết quả phân tích trên.

Hình 2: Biểu đồ phân bố điểm thi cả nước (màu xanh) và Hà Giang (màu hồng)

Sự khác biệt này có ý nghĩa thống kê với trị số P = 2.2^(-16) — 16 con số 0 trước 2.2! Điều này chứng tỏ rằng phân bố điểm ở Hà Giang có sự can thiệp.

Những số liệu trên tôi chỉ phân tích cho môn toán. Các bạn có thể dùng cách làm đó cho các môn khác.

Thuật toán GS đã dùng để thống kê 

Kết quả thống kê từ điểm thi các môn khác, đều cho thấy sự nhô lên bất thường của biểu đồ điểm thi tỉnh Hà Giang (màu đỏ) ở cột điểm cao (8-10 điểm)”

Liệu có sự gian lận trong thi cử ở tỉnh Hà Giang hay không? Hay chỉ là sự trùng hợp ngẫu nhiên. Mời quý độc giả cho ý kiến.

Thanh Long (TH)