Theo trang Guardian (Anh), trong 18 tháng sống trong căn hộ ở Tel Aviv, Ariel Karlinsky, sinh viên kinh tế 31 tuổi tại Đại học Hebrew ở Jerusalem, đã lùng sục khắp nơi trên mạng để tìm dữ liệu có thể giúp anh tính toán số người tử vong COVID-19 thực sự trên toàn cầu. Anh nghi ngờ về thông tin cho rằng tỷ lệ tử vong của Israel không cao hơn con số báo cáo và do đó, dịch bệnh này không nghiêm trọng.
“Tất nhiên, điều này không đúng. Tỷ lệ tử vong cao hơn những gì được báo cáo là điều chắc chắn và rất rõ ràng”, Karlinsky nói và đã đưa ra các con số để chứng minh điều đó, điều này rất dễ thực hiện ở Israel với hệ thống đăng ký nhân khẩu nghiêm ngặt.
Ở một số quốc gia không áp dụng hoặc áp dụng rất ít các biện pháp hạn chế phòng dịch, tỷ lệ tử vong thấp cũng là điều đáng nghi ngờ. Tuy nhiên, việc thu thập dữ liệu để chứng minh điều đó khá khó khăn. Karlinsky tin rằng hầu hết quốc gia đều đếm thiếu số ca tử vong trong đại dịch.
Qua Twitter, Karlinsky gặp nhà khoa học dữ liệu Dmitry Kobak của Đại học Tübingen ở Đức - người đang cố gắng làm điều tương tự và họ đồng ý hợp tác. Trong khi Karlinsky tìm kiếm các con số, Kobak tham gia phân tích. Kết quả là họ đã cho ra Tập dữ liệu về Tử vong Thế giới (World Mortality Dataset). Tập dữ liệu này đã tạo cơ sở cho các ước tính về tỷ lệ tử vong vì COVID-19 được công bố trên tờ Economist, Financial Times và nhiều trang báo hoặc tạp chí khác.
Các con số thực tế được công bố trên các tạp chí này thường cao hơn gấp nhiều lần so với con số được báo cáo chính thức trên toàn cầu, với trên 4,8 triệu người tử vong. Economist đưa ra con số thực tế là gần 16 triệu người.
Tập dữ liệu về tỷ lệ tử vong thế giới chứa thông tin về hơn 100 quốc gia. Hầu hết quốc gia châu Phi và châu Á đều nằm trong danh sách đếm thiếu số ca tử vong. Ấn Độ là một ví dụ, một số nhà nghiên cứu ước tính số người chết do COVID-19 ở nước này có thể lên tới 4 triệu người, thay vì hơn 450.000 người như được công bố.
Bộ dữ liệu mới cũng cho thấy các quốc gia từng hứng chịu làn sóng dịch nghiêm trọng như Italy, Tây Ban Nha và Anh, không thực sự bị ảnh hưởng nặng nề nhất. Theo tính toán của các nhà nghiên cứu, Mexico và Bolivia, và một số quốc gia ở Đông Âu, là những nước có tỷ lệ tử vong cao hơn 50% so với báo cáo. Đây đều là những nước bị tàn phá nặng nề nhất vì đại dịch. Trong đó, Peru được cho là quốc gia bị ảnh hưởng nặng nề nhất, với mức tăng 150%.
Các nhà nghiên cứu khác đã hoan nghênh nỗ lực của Karlinsky và Kobak. Hai nhà dịch tễ học Lone Simonsen tại Đại học Roskilde (Đan Mạch), và Cécile Viboud thuộc Viện Y tế Quốc gia Mỹ cho rằng: “Đây là cuộc cách mạng dữ liệu song song với quá trình phát triển vaccine và giải mã trình tự gien của virus”.
Có nhiều cách khác nhau có thể ước tính số người tử vong vì COVID-19, tất cả đều có ưu điểm và nhược điểm. Con số chính thức được lấy từ báo cáo của các quốc gia về số ca tử vong vì COVID-19, nhưng những báo cáo này phụ thuộc vào tỷ lệ xét nghiệm và hầu như luôn bị đánh giá thấp.
Nhà báo chuyên về dữ liệu Sondre Ulvund Solstad, người dẫn đầu nỗ lực theo dõi đại dịch của Economist, cho biết: “Ở phần lớn các quốc gia, các con số chính thức về số ca tử vong vì COVID-19 không đáng tin cậy”.
Cách tính số ca tử vong dựa trên xét nghiệm, đã được sử dụng để ước tính tỷ lệ tử vong của các đại dịch trong lịch sử, là một cách tính lỗi thời. Ở những nơi mà điều kiện xét nghiệm còn hạn chế, cách tính này đặc biệt không đáng tin cậy. Trong khi đó, số liệu ca tử vong thực tế được ước tính không phụ thuộc vào tỷ lệ xét nghiệm.
Cách tính tổng quát không chỉ ghi nhận những ca tử vong trực tiếp vì COVID-19, mà còn đếm cả người tử vong có liên quan gián tiếp đến đại dịch, chẳng hạn như bệnh nhân ung thư không được điều trị kịp thời, hoặc nạn nhân bị bạo hành trong gia đình trong thời gian phong tỏa hoặc áp đặt hạn chế.
Karlinsky và Kobak đã thu thập các nguồn dữ liệu địa phương từ những quốc gia nghèo dữ liệu thông qua các nhà báo, học giả, và áp dụng những kỹ thuật ngoại suy khác nhau để đưa ra ước tính.
Họ cũng ước tính dựa trên dữ liệu sẵn có từ một quốc gia láng giềng của mỗi nước, điều chỉnh các yếu tố như mật độ dân số, chiến lược xét nghiệm và tự do thông tin. Dự liệu không chắc chắn là lý do tại sao Karlinsky và Kobak tránh ước tính số người chết trên toàn cầu. Tuy nhiên, họ cho biết trung bình ở mỗi quốc gia, số ca tử vong thực tế có thể cao hơn 1,4 lần so với con số được báo cáo.
Trong khi đó, mô hình của nhà báo chuyên về dữ liệu của Econmist, Solstad, đã đưa ra con số tổng quát từ 9,9 triệu đến 18,5 triệu người tử vong, một phạm vi mà nhà dịch tễ học Simonsen thấy hợp lý.
Để so sánh số người tử vong vì COVID-19 với các đại dịch trước, nhà dịch tễ học Simonsen và Viboud đã đưa ra các ước tính về tỷ lệ tử vong thực tế cho những đại dịch trước đó và điều chỉnh chúng cho phù hợp với dân số thế giới vào năm 2020. Họ ước tính 4 đại dịch cúm vào các năm 1918, 1957, 1968 và 2009, nếu xảy ra ở hiện tại, thì sẽ có số người chết thực tế lần lượt là 75 triệu, 3,1 triệu, 2,2 triệu, và 0,4 triệu.
Từ đó, họ kết luận rằng COVID-19 là đại dịch chết chóc nhất trong vòng một thế kỷ qua, nhưng vẫn chưa bằng số người chết của đại dịch năm 1918.