Domino Effect AWS: Saat Internet ‘Tersedak’ karena Satu Titik Gagal

Article

Source: Midjourney

Pada hari Senin, 20 Oktober 2025, AWS mengalami gangguan besar yang berdampak global banyak situs web, aplikasi, dan layanan digital yang bergantung pada infrastrukturnya mengalami error, kelambatan akses (latency) tinggi, atau mati total. Pusat dari pemadaman ini adalah Region US-EAST-1 AWS, yang berlokasi di Virginia Utara. Wilayah ini sering dianggap sebagai salah satu “jantung” internet global karena menampung infrastruktur inti untuk ribuan perusahaan. Menurut laporan dari AWS, akar masalahnya adalah masalah resolusi DNS yang memengaruhi endpoint API untuk DynamoDB, salah satu layanan database NoSQL andalan mereka. Sederhananya, DNS (Domain Name System) berfungsi seperti buku telepon internet, menerjemahkan nama domain yang mudah diingat (seperti google.com) menjadi alamat IP yang dipahami komputer. Dalam kasus ini, layanan yang mencoba “menelepon” DynamoDB tidak dapat menemukan nomor yang tepat. Akibatnya, aplikasi yang bergantung pada database ini untuk menyimpan dan mengambil data pengguna mulai dari info login, skor game, hingga transaksi keuangan mengalami kegagalan beruntun.

Dampak di Berbagai Layanan

Kegagalan satu layanan inti di satu wilayah dengan cepat menyebar menjadi efek domino global. Daftar layanan yang terdampak sangat luas dan mencakup hampir setiap sektor:

Media Sosial & Komunikasi: Pengguna Snapchat dan Signal tidak dapat mengirim atau menerima pesan. Platform kolaborasi seperti Slack juga mengalami gangguan.
Gaming & Hiburan: Judul game besar seperti Fortnite, Roblox, dan Pokémon Go lumpuh total, membuat jutaan pemain tidak bisa login. PlayStation Network juga melaporkan masalah.
Layanan Finansial (Fintech): Aplikasi perdagangan populer seperti Coinbase dan Robinhood, serta layanan pembayaran Venmo, mengalami gangguan, menghalangi pengguna mengakses dana atau melakukan transaksi.
Ekosistem Amazon Sendiri: Ironisnya, pemadaman ini juga melumpuhkan layanan Amazon sendiri. Situs ritel Amazon.com mengalami error, asisten suara Alexa tidak dapat merespons, dan kamera keamanan Ring berhenti merekam.
Lain-lain: Layanan produktivitas seperti Canva, maskapai penerbangan besar, dan bahkan beberapa outlet berita yang melaporkan kejadian ini, juga terkena dampaknya.

Source: https://dgtlinfra.com/wp-content/uploads/2022/06/Amazon-Web-Services-AWS-Virginia-Map-1536×670.jpg.webp

Kronologi singkat

Awal Mula Masalah (19 Oktober malam / 20 Oktober siang WIB): Sekitar 19 Oktober, 23:49 PDT (20 Oktober, 13:49 WIB): AWS mulai mencatat “peningkatan tingkat kesalahan dan latensi” untuk beberapa layanannya. Pusat masalah teridentifikasi di Region US-EAST-1 (Virginia Utara), salah satu pusat data terbesar dan terpenting di dunia.
Identifikasi Akar Masalah (20 Oktober dini hari / 20 Oktober sore WIB): Sekitar 20 Oktober, 00:26 PDT (14:26 WIB): Setelah investigasi awal, teknisi AWS mengidentifikasi akar masalah: kegagalan pada resolusi DNS (Domain Name System). Secara spesifik, ini memengaruhi endpoint API untuk DynamoDB, layanan database inti yang digunakan oleh ribuan aplikasi untuk menyimpan dan mengambil data.
Dampak Global (20 Oktober dini hari / 20 Oktober sore WIB): Sekitar 00:30 PDT – 02:00 PDT (14:30 – 16:00 WIB): Kegagalan DynamoDB memicu efek domino. Aplikasi dan situs web di seluruh dunia yang bergantung pada infrastruktur US-EAST-1 mulai lumpuh. Layanan yang terdampak parah termasuk Snapchat, Fortnite, Roblox, Coinbase, Venmo, Slack, dan banyak lainnya. Layanan internal Amazon seperti Alexa, kamera Ring, dan situs belanja Amazon.com juga mengalami gangguan.
Proses Mitigasi (20 Oktober dini hari / 20 Oktober sore WIB): Sekitar 02:24 PDT (16:24 WIB): AWS mengumumkan bahwa mereka telah “memitigasi sepenuhnya” masalah DNS yang menjadi akar penyebabnya. Ini berarti “buku telepon” internet telah diperbaiki, dan layanan dapat kembali menemukan database DynamoDB.
Pemulihan Bertahap (20 Oktober pagi-siang / 20 Oktober malam WIB): 02:30 PDT – 12:00 PDT (16:30 – 21 Oktober, 02:00 WIB): Meskipun masalah utama telah diperbaiki, pemulihan tidak instan. Terjadi penumpukan (backlog) permintaan data yang sangat besar. AWS juga melaporkan bahwa beberapa “subsistem internal” masih terganggu akibat kegagalan awal. Untuk menstabilkan sistem, AWS terpaksa melakukan throttling (pembatasan) pada beberapa layanan, terutama peluncuran instans server EC2 baru, yang memperlambat pemulihan bagi sebagian pelanggan.
Pemulihan Signifikan (20 Oktober siang / 21 Oktober dini hari WIB): Sekitar 12:28 PDT (21 Oktober, 02:28 WIB): AWS melaporkan bahwa sebagian besar layanan telah “pulih secara signifikan” dan mereka terus mengurangi pembatasan (throttling) EC2.
Resolusi Penuh (20 Oktober sore / 21 Oktober pagi WIB): Sekitar 15:01 PDT (21 Oktober, 05:01 WIB): AWS secara resmi mengumumkan bahwa semua layanan telah kembali beroperasi normal. Total waktu dari deteksi awal hingga pemulihan penuh memakan waktu sekitar 15 jam.

Mengapa ini penting

Ketergantungan infrastruktur cloud: kejadian ini menyoroti betapa banyak layanan kritis sehari-hari bergantung pada satu atau beberapa penyedia cloud besar. Ketika AWS (yang menguasai sebagian besar pasar cloud) bermasalah, efeknya bisa sangat luas.
Risiko “single point of failure”: Meskipun distribusi geografi (multi-region), pusat layanan US-EAST-1 ternyata sangat vital sehingga mengalami gangguan di situ bisa membuat efek domino.
Implikasi bisnis dan reputasi: Gangguan seumur itu dapat menimbulkan kerugian produktivitas, pendapatan, dan kepercayaan terhadap penyedia layanan cloud.
Isu regulasi dan keamanan: Beberapa negara kini mempertanyakan apakah penyedia cloud besar seperti AWS harus diatur sebagai infrastruktur “kritis” untuk keamanan nasional atau stabilitas ekonomi.

Kesimpulan

Meskipun AWS berhasil mengidentifikasi dan memitigasi masalah DNS dalam beberapa jam, proses pemulihan penuh memakan waktu lebih lama. Sistem perlu pulih dari tumpukan permintaan yang gagal dan AWS harus membatasi (throttling) beberapa layanan, seperti peluncuran instans EC2 baru, untuk menstabilkan jaringan. Insiden ini sekali lagi memicu perdebatan sengit tentang sentralisasi internet. Ketika begitu banyak perusahaan—dari startup kecil hingga raksasa global bergantung pada segelintir penyedia cloud (seperti AWS, Microsoft Azure, dan Google Cloud), kegagalan di satu titik dapat menimbulkan konsekuensi yang tidak proporsional. Para ahli mencatat bahwa meskipun infrastruktur cloud menawarkan skalabilitas dan efisiensi yang luar biasa, pemadaman ini berfungsi sebagai pengingat penting bagi perusahaan untuk merancang arsitektur yang lebih tangguh, seperti strategi multi-region atau bahkan multi-cloud, untuk menghindari kelumpuhan total saat satu penyedia gagal.

Penulis:

Samson Ndruru, S.Kom., M.Kom. (FDP Scholar)

Daftar Pustaka:

Al Jazeera. (2025, October 20). Amazon cloud problems spur outage of global websites and apps. Al Jazeera. https://www.aljazeera.com/news/2025/10/20/amazon-cloud-problems-spur-outage-of-global-websites-and-apps
Associated Press. (2025, October 20). Massive Amazon cloud outage has been resolved after disrupting internet use worldwide. AP News. https://apnews.com/article/654a12ac9aff0bf4b9dc0e22499d92d7
Business Insider. (2025, October 20). DNS error blamed for major AWS outage impacting Amazon, Snapchat, Reddit, and Venmo. Business Insider. https://www.businessinsider.com/dns-error-major-aws-outage-amazon-snapchat-reddit-venmo-2025-10
Financial Times. (2025, October 20). Amazon says cloud services recovering from widespread outage. Financial Times. https://www.ft.com/content/f9d13a0e-9378-429c-9be0-5f15f649cc3f
Murdoch, S. (2025, October 20). Quoted in The Guardian: Amazon Web Services outage shows internet users ‘at mercy’ of too few providers. The Guardian. https://www.theguardian.com/technology/2025/oct/20/amazon-web-services-aws-outage-hits-dozens-websites-apps
NBC Chicago. (2025, October 20). What caused massive outage for thousands of sites? What to know about AWS incident. NBC Chicago. https://www.nbcchicago.com/news/local/what-caused-massive-outage-for-thousands-of-sites-what-to-know-about-aws-incident/3840831
NBC New York. (2025, October 20). AWS outage: Amazon Web Services down, affecting Venmo and Ring app users. NBC New York. https://www.nbcnewyork.com/news/tech/aws-outage-amazon-web-services-down-venmo-ring-app/6407333