Analisis Mutu Data Time Series Covid-19: Studi kasus di Covid-19 Data Repository by the Center for Systems Science and Engineering (CSSE) at Johns Hopkins University
No TL;DR found
Abstract
Covid-19 adalah penyakit menular yang disebabkan oleh SARS-CoV-2, yang merupakan salah satu jenis dari koronavirus. Sejak awal kemunculannya pada akhir tahun 2019, hingga 2 Agustus 2020 telah ada lebih dari 17,7 juta penduduk dunia yang terinfeksi. Dalam selang waktu itu muncul berbagai penelitian untuk mempelajari pandemi covid-19 ini dan salah satunya adalah penelitian mengenai perkembangan jumlah kasus covid-19. Salah satu dari sekian banyak dataset yang digunakan dalam mempelajari perkembangan jumlah kasus covid-19 adalah data dari COVID-19 Data Repository by the Center for Systems Science and Engineering (CSSE) at Johns Hopkins University. Tujuan dari penelitian ini adalah untuk menganalisis mutu dari data tersebut dan mendeteksi error yang terjadi pada data, sehingga para peneliti yang akan menggunakan data tersebut mengetahui mutu dari data sebelum menggunakannya. Penelitian ini menggunakan pendekatan statistical quality control dengan metode yang digunakan dalam penelitian ini adalah acceptance sampling dan control chart. 30% out of control data akan dikeluarkan menggunakan control chart untuk diteliti mengenai keberadaan error yang mungkin terjadi. Setelah itu, data diperbaiki sesuai dengan error yang terjadi. Proses ini dilakukan secara berulang, hingga tidak ditemukan lagi error pada data. Setelah dilakukan beberapa kali iterasi, pada data covid-19 yang diteliti masih ditemukan error. Error yang ditemukan adalah kesalahan input data, decreasing value, data confirm kurang dari recover, data confirm kurang dari death, zero confirm on first date, not zero recover on first date, dan not zero death on first date. Disarankan kepada pihak yang menggunakan data dengan sumber ini untuk melakukan pengecekkan dan koreksi terlebih dahulu sebelum menggunakannya