Kenapa Copy File Lama Banget di 1% Terakhir? Penjelasan ‘Long Tail’ yang Perlu Kamu Tahu
Gambar 1. Progress Bar
Sumber: https://www.galaxus.at/en/page/why-does-the-progress-bar-get-stuck-at-99-per-cent-24055
Salah satu misteri terbesar di dunia teknologi bukanlah AI atau robot, melainkan sebuah kotak kecil bernama progress bar. Kita kerap kali mengira komputer adalah mesin yang presisi. Tapi, kenapa saat kita melakukan copy-paste file, estimasi waktunya jauh dari kata ‘tepat’ alias “PHP”? Awalnya 2 menit, tiba-tiba melonjak 3 jam, lalu turun lagi ke 30 detik.
Fenomena ini sering jadi bahan lelucon, tapi bagi computer scientist, ini bukan sesuatu yang remeh. Memprediksi waktu dalam sistem komputer bukanlah perhitungan matematika yang pasti, melainkan sesuatu yang bersifat acak dan fluktuatif. Pola ketidakpastian waktu ini dikenal membentuk pola distribusi Gamma, sebuah distribusi probabilitas yang sangat terkenal dalam ilmu statistika. Mari kita beda kenapa perilaku waktu di komputer bisa begitu “liar”, dan angka yang lompat-lompat itu sebenarnya adalah hal yang wajar secara matematis.
Matematika SD yang Tak Berdaya
Secara teori, menghitung “sisa waktu” seharusnya menjadi tugas yang sangat mudah bagi komputer. Sesederhana permasalahan matematika di bangku SD:
Sisa waktu = Sisa data : kecepatan transfer
Misalkan jika kita punya file 1.000 MB dan kecepatan transfer saat ini 100 MB/detik, maka komputer perlu 10 detik untuk menyalin file tersebut.
Ini yang menjadi masalah utamanya: sistem operasi kerap menggunakan logika sederhana ini. Mereka mengambil kecepatan rata-rata dalam beberapa detik terakhir, lalu mengasumsikan kalau kecepatan tersebut akan stabil hingga akhir. Realitanya, apa yang terjadi di dalam hard disk jauh lebih brutal. Ada faktor tersembunyi yang disebut “Overhead”.
Bayangkan Anda bekerja sebagai kurir. Jika tugas Anda mengantar satu kulkas besar (satu file besar), Anda cukup angkat sekali, masukkan ke dalam truk, lalu jalan dengan lancer di jalan tol. Ini disebut sebagai Sequential Access. Tapi, bagaimana jika tugas Anda mengantar 1.000 surat (ribuan file kecil) ke alamat yang berbeda-beda? Meski total berat surat itu sama dengan satu kulkas, waktu yang dibutuhkan jauh lebih lama. Hal ini terjadi karena Anda terkena overhead: Anda harus berhenti di setiap rumah, mengecek alamat, turun dari truk, mengetuk pintu, dan minta tanda tangan.

Gambar 2. Ilustrasi Penyalinan File Besar vs. File Kecil
Hal yang sama terjadi pada komputer. Saat menyalin ribuan file kecil, komputer tidak hanya memindahkan data mentah, namun juga melakukan tugas administratif: membaca header, mencatat lokasi di tabel sistem, dan membuka-tutup akses file. Komputer jadi lebih sibuk mengurus administrasi daripada benar-benar memindahkan data. Akibatnya, kecepatan transfer menjadi sangat fluktuatif.
Karena kecepatan berubah-ubah secara acak tergantung jenis filenya, maka waktu pengiriman bukan lagi angka pasti, melainkan sebuah variabel acak. Disinilah rumus “matematika SD” tidak mampu menjelaskan, dan perlu konsep lebih lanjut dalam ilmu statistik yang disebut distribusi Gamma.
Mengenal Distribusi Gamma, Si Kurva “Ekor Panjang”
Statistik terkenal dengan kurva lonceng (bell-shape) milik distribusi normal. Kurva ini simetris dan banyak digunakan untuk memodelkan data di dunia nyata. Contohnya tinggi badan manusia; kebanyakan orang ada di tengah-tengah (rata-rata), sangat sedikit yang kerdil, dan sangat sedikit yang raksasa.
Namun, perilaku waktu dalam komputer tidak simetris seperti itu. Bayangkan proses menyalin sebuah folder sebagai serangkaian ribuan tugas kecil yang harus diselesaikan satu demi satu. Setiap file butuh waktu acak untuk disalin. Ada yang cepat, ada juga yang lambat.
Dalam ilmu probabilitas, jika kita menjumlahkan waktu tunggu dari serangkaian kejadian acak beruntun, hasilnya akan membentuk pola distribusi Gamma. Seperti dijelaskan dalam buku klasik Probability and Statistics karya Kishor S. Trivedi (2001), distribusi ini sering digunakan para insinyur untuk memodelkan total waktu penyelesaian tugas yang bertahap. Ciri khas kurva distribusi ini adalah tidak simetris dan memiliki “ekor panjang” (long tail) yang menjulur ke kanan.

Gambar 3. Kurva Distribusi Gamma
Sumber: https://brilliant.org/wiki/gamma-distribution/
Apa maksud dari “ekor panjang” ini? Maksudnya, ada peluang kecil bahwa waktu tunggu bisa menjadi sangat lama. Kejadian ekstrem ini cukup lumrah terjadi, seperti tiba-tiba komputer hang selama 30 detik saat bertemu file yang corrupt. Fenomena ini mirip dengan fenomena The Tail at Scale (Dean & Barroso, 2013), dimana kejadian ekstrem yang jarang terjadi justru menjadi penentu utama kekesalan pengguna.
Kesimpulan – Mengapa Kita Sering Tertipu di 99%?
Jadi, kenapa estimasi waktu komputer sering meleset, atau kenapa loading sering macet lama sekali di angka 99%?
Jawabannya ada pada “ekor panjang” dari distribusi Gamma. Otak manusia dan juga logika yang digunakan software sudah terbiasa berpikir dengan pola yang sederhana. Jika 99% data sudah tersalin dalam 5 menit, maka 1% sisanya pasti selesai dalam hitungan detik.
Distribusi Gamma mengajarkan bahwa 1% terakhir sering kali jatuh di bagian ‘ekor panjang’ kurva: tugas jarang yang memakan waktu lama, seperti verifikasi data. Jadi, saat progress bar membeku di angka 99%, komputer Anda tidak rusak. Anda hanya sedang melihat visualisasi ketidakpastian statistik yang sangat wajar terjadi dalam dunia digital kita.
Penulis:
Rilo Chandra Pradana, S.Si., M.Kom.
Referensi:
Trivedi, K. S. (2001). Probability and statistics with reliability, queuing, and computer science applications. John Wiley & Sons.
Dean, J., & Barroso, L. A. (2013). The tail at scale. Communications of the ACM, 56(2), 74-80.