CrowdStrike Reveals Cause of Bug on 8.5 Million Windows PCs

CrowdStrike Reveals Cause of Bug on 8.5 Million Windows PCs
Photo: tomsguide.com

The massive damage that occurred due to updates from Crowdstrike turned out to have a simpler reason than imagined. According to the cybersecurity company, the testing software they used was the main culprit, as it did not detect major issues before the update was released globally. 

Explanation from Crowdstrike

Crowdstrike finally decided to issue a statement on their website regarding the incident that occurred on July 19 and has affected Windows computers around the world. The main problem lies in testing software that failed to detect problems with the update, resulting in a mess that made headlines in various media last weekend. 

Now, Crowdstrike has a big challenge to restore their reputation. Even though it has been operating for a long time, this company is not very well known to the general public. As time goes by, perhaps this mistake will be forgotten, but critical situations like this can call the company's reputation into question. 

Unprecedented Global Disruption

Although the 8.5 million computers affected seems small compared to the billions of computers operating every day. The impact of this error is very significant as it affects important logistics points such as airports, train stations and companies. As a result, although only 8.5 million devices were affected, the impact of the outage was felt by millions of people as critical services were disrupted. 

It also shows the negative side of an increasingly connected world. The even distribution of technological progress and the decreasing technological gap make problems like this have a global impact. This error in Windows also has a big impact on other countries, even though the center of the problem is in the United States. Crowdstrike itself has apologized for this error and promised to work hard so that a similar incident does not happen again. 

CrowdStrike Reveals the Cause of Mass Windows Blue Screens
Photo: Doc. Crowdstrike

- Cybersecurity company CrowdStrike reveals more information about the problematic update that crashed millions of Windows devices last week. It seems that the culprit behind this problematic update is the testing software that is not functioning properly. 

In a recently released post-incident review (PIR), CrowdStrike said the testing software failed to properly validate the update content before it was released to millions of devices on Friday (19/7). In the future, CrowdStrike promises to thoroughly test update content. 

"Due to a bug in Content Validation, one of the two (updates) passed validation even though it contained problematic data," said CrowdStrike in his post, as quoted from Engadget, Thursday (25/7/2024). 

SCROLL TO CONTINUE WITH CONTENT

To prevent DDoS and other cyber attacks, CrowdStrike has software called Falcon Sensor. This software contains Sensor Content which functions at the kernel level in Windows and uses 'Template Type' to determine how to defend against cyber threats. 
CrowdStrike also released Rapid Response Content which updates sensor behavior to detect malware in the form of 'Template Instances'. On July 19, two Template Instances were released and one of them (the 40KB one) passed validation even though it contained problematic data. 

"When received by the sensor and loaded into the Content Interpreter, it causes an out-of-bounds memory read that triggers an exception. This unexpected exception cannot be handled properly, resulting in a Windows operating system crash (BSOD)," explained CrowdStrike. 
This mass blue screen was experienced by a number of companies throughout the world. This issue forces the Windows device into a boot loop and a technician must access the device directly to fix it. As a result, important services such as aviation, broadcasting, health, etc. were disrupted. 

To prevent this incident from happening again, CrowdStrike promised to take a number of preventative steps. First, they will test Rapid Response content more thoroughly, including local developer testing, update content, and rollback testing, stress testing, stability testing, etc. 
CrowdStrike will also add validation checks and improve error handling. Furthermore, they will use a phased release strategy for Rapid Response Content to avoid a repeat of the global outage, as well as giving customers greater control over update content and providing release notes. 

Impact of Global IT Outage, Cyber ​​Experts Difficult to Predict Recovery Time
CrowdStrike logo (photo: CrowdStrike)

- The entire world was shocked by the news of a global IT outage of Windows devices, impacting thousands of business entities worldwide, including airports and banks. 

It is also known that this is due to an issue with a software update released by cybersecurity vendor Crowdstrike. Based on official statements from either Microsoft or CrowdStrike, there are around 8.5 million devices affected by the outage that has occurred since July 19. At this stage,  Head of Threat Research at Kaspersky, Alexander Liskin, says that it is difficult to estimate how long it will take to fix the problem. 

“The difficulty lies in the fact that when such problems occur, each device (computer, laptop or server) must be rebooted to safe mode manually; this cannot be done using management tools,” he said in a statement. 

Thus, it can be said that this problem is indeed a very serious problem that has affected many processes, including critical infrastructure. According to Liskin, to avoid such situations, information security vendors must be extremely responsible about the quality of the updates they release. Later, he also added the importance of adhering to detailed update release principles. This means that the update should not be distributed globally all at once. 

SEE ALSO:

"But gradually, so that if an unexpected failure occurs, it can be localized and repaired quickly," he said further. Additionally, Liskin also emphasized the need for software companies to monitor and immediately respond to any situation by immediately stopping updates. “Problem solving is a priority at all levels of the company. "As with all cyber incidents, it is important to not only eliminate the visible damage, but also find and fix the root cause to prevent similar incidents in the future," he concluded. 


CrowdStrike Ungkap Penyebab Bug 8,5 Juta PC Windows


Foto: tomsguide.com

Kerusakan besar-besaran yang terjadi akibat pembaruan dari Crowdstrike ternyata punya alasan yang lebih sederhana dari yang dibayangkan. Menurut perusahaan keamanan siber tersebut, perangkat lunak pengujian yang mereka gunakan menjadi penyebab utama, karena tidak mendeteksi masalah besar sebelum pembaruan tersebut dirilis secara global.

Penjelasan dari Crowdstrike

Crowdstrike akhirnya memutuskan untuk mengeluarkan pernyataan di situs web mereka terkait insiden yang terjadi pada 19 Juli lalu telah memengaruhi komputer Windows di seluruh dunia. Masalah utama terletak pada perangkat lunak pengujian yang gagal mendeteksi masalah pada pembaruan, sehingga menimbulkan kekacauan yang menjadi berita utama di berbagai media akhir pekan lalu.

Sekarang, Crowdstrike memiliki tantangan besar untuk memulihkan reputasi mereka. Meski sudah lama beroperasi, perusahaan ini belum terlalu dikenal oleh publik umum. Dengan berjalannya waktu, mungkin kesalahan ini akan dilupakan, tapi situasi kritis seperti ini bisa membuat reputasi perusahaan dipertanyakan.

Gangguan Global yang Belum Pernah Terjadi

Meskipun 8,5 juta komputer yang terkena dampak terlihat sedikit dibandingkan dengan miliaran komputer yang beroperasi setiap hari. Dampak dari kesalahan ini sangat signifikan karena memengaruhi titik-titik logistik penting seperti bandara, stasiun kereta, dan perusahaan. Akibatnya, meski hanya 8,5 juta perangkat yang terpengaruh, dampak dari gangguan tersebut dirasakan oleh jutaan orang karena layanan penting terganggu.

Ini juga menunjukkan sisi negatif dari dunia yang semakin terhubung. Kemajuan teknologi yang merata dan semakin sedikitnya kesenjangan teknologi membuat masalah seperti ini memiliki dampak global. Kesalahan pada Windows ini juga sangat berdampak ke negara lain, meskipun pusat gangguan berada di Amerika Serikat. Crowdstrike sendiri sudah meminta maaf atas kesalahan ini dan berjanji untuk bekerja keras agar kejadian serupa tidak terulang kembali.

CrowdStrike Ungkap Biang Kerok Windows Blue Screen Massal

Crowdstrike
Foto: Dok. Crowdstrike
Perusahaan keamanan siber CrowdStrike mengungkap lebih banyak informasi tentang update bermasalah yang membuat jutaan perangkat Windows tumbang pekan lalu. Rupanya biang kerok update bermasalah ini adalah software penguji yang tidak berfungsi semestinya.

Dalam ulasan pasca insiden (PIR) yang baru saja dirilis, CrowdStrike mengatakan software penguji itu gagal memvalidasi konten update dengan benar sebelum dirilis ke jutaan perangkat pada Jumat (19/7) kemarin. Ke depannya, CrowdStrike berjanji akan menguji konten update secara menyeluruh.

"Karena bug di Content Validaor, salah satu dari dua (update) lolos validasi meskipun berisi data bermasalah," kata CrowdStrike dalam postingannya, seperti dikutip dari Engadget, Kamis (25/7/2024).

SCROLL TO CONTINUE WITH CONTENT

Guna mencegah DDoS dan serangan siber lainnya, CrowdStrike memiliki software bernama Falcon Sensor. Software ini berisi Sensor Content yang berfungsi di level kernel di Windows dan menggunakan 'Template Type' untuk menentukan cara pertahanannya terhadap ancaman siber.

CrowdStrike juga merilis Rapid Response Content yang memperbarui perilaku sensor untuk mendeteksi malware dalam bentuk 'Template Instances'. Pada 19 Juli, dua Template Instances dirilis dan salah satunya (yang berukuran 40KB) lolos validasi padahal berisi data bermasalah.

"Ketika diterima oleh sensor dan dimuat ke dalam Content Interpreter, ini menyebabkan pembacaan memori di luar batas yang memicu pengecualian. Pengecualian yang tidak terduga ini tidak bisa ditangani dengan baik, yang mengakibatkan sistem operasi Windows crash (BSOD)," jelas CrowdStrike.

Blue screen massal ini dialami sejumlah perusahaan di seluruh dunia. Masalah ini memaksa perangkat Windows mengalami boot loop dan teknisi harus mengakses perangkat secara langsung untuk memperbaikinya. Akibatnya layanan penting seperti penerbangan, penyiaran, kesehatan, dan lain-lain sempat tumbang.

Untuk mencegah insiden ini terulang lagi, CrowdStrike berjanji akan mengambil sejumlah langkah pencegahan. Pertama, mereka akan menguji konten Rapid Response dengan lebih menyeluruh, termasuk uji developer lokal, konten update, dan rollback testing, stress testing, stability testing, dan lain-lain.

CrowdStrike juga akan menambahkan pemeriksaan validasi dan meningkatkan penanganan error. Lebih lanjut, mereka akan menggunakan strategi rilis bertahap untuk Rapid Response Content guna menghindari terulangnya gangguan global, serta memberikan pelanggan kontrol yang lebih besar atas konten update dan menyediakan release notes.


Imbas Pemadaman TI Global, Pakar Siber Sulit untuk Memprediksi Waktu Pemulihan


Imbas Pemadaman TI Global, Pakar Siber Sulit untuk Memprediksi Waktu Pemulihan
Logo CrowdStrike (foto: CrowdStrike)

- Seluruh dunia tengah dihebohkan dengan berita tentang pemadaman TI global perangkat Windows, yang berdampak pada ribuan entitas bisnis di seluruh dunia, termasuk bandara dan perbankan. 

Sudah diketahui juga bahwa hal ini disebabkan oleh masalah pembaruan perangkat lunak yang dirilis oleh vendor keamanan siber Crowdstrike.

Berdasarkan pernyataan resmi baik dari Microsoft atau CrowdStrike, ada sekitar 8,5 juta perangkat yang terdampak akibat pemadaman yang terjadi sejak 19 Juli ini. 

Pada tahap ini,  Head of Threat Research di Kaspersky, Alexander Liskin, mengatakan bahwa sulit untuk memperkirakan berapa lama waktu yang dibutuhkan untuk memperbaiki masalah tersebut. 

“Kesulitannya terletak pada kenyataan bahwa ketika masalah tersebut terjadi, setiap perangkat (komputer, laptop atau server) harus di-boot ulang ke mode aman secara manual; ini tidak dapat dilakukan dengan menggunakan alat manajemen,” katanya dalam sebuah pernyataan. 

Dengan demikian, bisa dikatakan bahwa masalah ini memang merupakan masalah yang sangat serius yang telah mempengaruhi banyak proses, termasuk pada infrastruktur penting.

Menurut Liskin, untuk menghindari situasi seperti itu, vendor keamanan informasi harus sangat bertanggung jawab terhadap kualitas pembaruan yang mereka rilis. 

Kemudian, dia juga menambahkan pentingnya untuk mematuhi prinsip rilis pembaruan yang terperinci. Artinya, pembaruan tersebut seharusnya tidak didistribusikan secara global secara bersamaan. 

SEE ALSO:

“Namun secara bertahap, sehingga jika terjadi kegagalan yang tidak terduga, dapat dilokalisasi dan diperbaiki dengan cepat,” ujarnya lebih lanjut. 

Selain itu, Liskin juga menegaskan perlunya perusahaan perangkat lunak untuk memantau dan segera merespons situasi apa pun dengan segera menghentikan pembaruan.

“Pemecahan masalah menjadi prioritas di seluruh tingkatan perusahaan. Seperti semua insiden dunia maya, penting untuk tidak hanya menghilangkan kerusakan yang terlihat, namun juga menemukan dan memperbaiki akar permasalahan untuk mencegah insiden serupa di masa depan,” pungkasnya. 

Post a Comment

0 Comments