Thứ ba, 02/02/2021 10:50

Một số vấn đề về phương pháp nghiên cứu

GS Nguyễn Văn Tuấn

Khoa Y, Đại học New South Wales và Đại học Công nghệ Sydney, Úc

Tác giả nêu 10 vấn đề phổ biến thường gặp trong nghiên cứu: 1) thiếu cỡ mẫu; 2) sai lệch và sai lệch đồng căn; 3) Nghịch lý phần trăm; 4) Chia nhóm theo kiểu nhị phân; 5) Máy móc và stepwise regression; 6) Over-fitting hay “đại số đạo đức”; 7) Bệnh “viêm thống kê”; 8) Tra tấn dữ liệu; 9) Cỡ mẫu quá lớn; 10) Diễn giải sai khoảng tin cậy 95%.

Thiếu cỡ mẫu: các nghiên cứu không đủ cỡ mẫu, có độ nhạy (power) thấp và do đó cho ra kết quả không đáng tin cậy. Ít người biết rằng, nghiên cứu với cỡ mẫu thấp (số tế bào, số bệnh nhân…) thường cho ra kết quả dương tính, nhưng kết quả đó rất khó lặp lại (tức dởm). Nghiên cứu có cỡ mẫu không đủ chẳng khác gì mất điện trong đời thường.

Sai lệnh và sai lệch đồng căn: trùng hợp và va chạm (confounding and collision). Đây là những sai sót về cách chọn mẫu, về yếu tố nhiễu và một sai lệch mà ít người biết đến: sai lệch đồng căn (collider). Mấy sai lệch này có thể làm cho kết quả nghiên cứu sai. Trong thực tế có thể X và Y chẳng có liên quan gì với nhau, nhưng bằng chọn chọn mẫu (ví dụ như trong bệnh viện) thì X và Y lại có liên quan! Lý do là do sai lệch (bias) trong chọn mẫu và yếu tố nhiễu.

Nghịch lý phần trăm (percentage fallacy): là những sai sót về phân tích số phần trăm trong nghiên cứu theo thời gian. Nhiều người không nhận ra rằng, khi theo dõi bệnh nhân ở 2 thời điểm với 2 giá trị (x1 và x2) thì cách tính phần trăm thay đổi kiểu (x2 - x1)/x1*100 là chưa đúng. Đa số các nhà nghiên cứu không am hiểu thường dùng ANOVA cho nghiên cứu theo thời gian, nhưng phương pháp này dễ dẫn đến sai lầm.

Chia nhóm theo kiểu nhị phân: rất rất nhiều người (nhất là ở Việt Nam) thích chia một biến số liên tục thành 2 nhóm (kiểu “cao” và “thấp”), nhưng họ không hiểu rằng cách phân chia này là sai về lý thuyết đo lường. Ví dụ như chia độ tuổi theo kiểu 0-9, 10-19, 20-29... và dùng đó như là biến tiên lượng. Nhưng cách chia nhóm này rất dở vì làm mất thông tin và có thể dẫn đến kết quả sai lệch.
Máy móc và stepwise regression: rất rất nhiều người dùng phương pháp stepwise để chọn biến số liên quan, nhưng phương pháp này đã bị chứng minh là cho ra kết quả không đúng lâu rồi. Tệ nhất là cứ để cho máy làm mà không chịu đầu tư suy nghĩ, đó là “bệnh máy móc”. Bệnh này không chịu dùng kiến thức chuyên môn mà cứ để cho máy điều khiển mình. Bệnh này rất phổ biến.

Over-fitting hay “đại số đạo đức”: ví dụ một người trước khi đi đến hôn nhân đã tính toán lợi và hại khi lập gia đình. Trong danh sách lợi, hại, người đó cho rằng có người tâm sự thủ thỉ là lợi, nhưng hại là tốn tiền và ít có thời gian đọc sách. Đó là over-fitting theo ngôn ngữ ngày nay. Nhiều người làm nghiên cứu chỉ có 10 người bị bệnh trong số 1000 người, nhưng họ có đến 20 biến tiên lượng - đó là over-fitting, mô hình thái quá.

Bệnh ‘viêm thống kê’ (significosis): những người làm nghiên cứu mắc bệnh này hay chạy theo trị số P và họ làm mọi cách để sao cho P < 0,05 cho công bố khoa học. Trị số P < 0,05 được xem là “giấy thông hành” cho công bố khoa học. Bệnh này càng ngày càng nhiều trong giới khoa học và hiện nay vẫn chưa có thuốc trị. Có thuốc Bayes (một phương pháp khác), nhưng ít ai chịu uống.

Tra tấn dữ liệu (data torture): nhiều nhà nghiên cứu trở thành những chuyên gia tra tấn dữ liệu cho đến khi nào chúng khai P < 0,05. Thói quen này xuất phát từ nghiên cứu có ra kết quả ‘tiêu cực’, nên họ trở nên nóng nảy và phải dùng đến biện pháp tra tấn dữ liệu. Mà, cũng như tù nhân, càng tra tấn thì họ càng khai bậy, tra tấn dữ liệu nhiều quá chúng cũng cho ra kết quả sai. Tra tấn tù nhân là tội phạm; tra tấn dữ liệu là vi phạm đạo đức khoa học.

Cỡ mẫu quá lớn: một số nhà nghiên cứu không nhận ra rằng với nghiên cứu mà cỡ mẫu quá lớn (như hàng trăm nghìn hay hàng triệu) thì trị số P ~ 0,05 không còn ứng dụng nữa. Những nghiên cứu quá lớn này rất dễ cho ra kết quả có ý nghĩa thống kê, nhưng là kết quả vô nghĩa. Một chỉ số Q (của IJ Good) có thể giải quyết vấn đề này.

Diễn giải sai khoảng tin cậy 95%: đây là những người diễn giải sai khoảng tin cậy 95% là xác suất 95%. Chẳng hạn như nếu “95% confidence interval of RR ranged from 1.1 to 2.1” họ diễn giải là “Xác suất RR dao động từ 1,1 đến 2,1 là 95%”, nhưng diễn giải/hiểu này sai. Có thể gọi đó là ‘wishful thinking’ (mơ tưởng). Có thể nói rằng 99% các nhà khoa học trên thế giới đều hiểu sai như thế. Cách diễn giải đó chỉ có thể qua phương pháp Bayes mà thôi.

 

Đánh giá

X
(Di chuột vào ngôi sao để chọn điểm)