로저스 정전 사태가 장애 조치에 대해 우리에게 주는 교훈

글: | 7월 18, 2022

캐나다 통신사 로저스 커뮤니케이션즈가 최근 잘못된 유지보수 업데이트로 인해 네트워크가 중단되었다는 소식을 들어보셨을 것입니다. 이는 큰 것.

실제로 캐나다의 낡은 통신법 덕분에 다음과 같은 많은 혜택을 누릴 수 있습니다. 적극적으로 권장하지 않습니다. 경쟁을 촉진하고 먹이사슬의 최상위에서 통합을 장려합니다 - 정전으로 인해 인상적인 25% 의 인터넷 트래픽을 처리합니다.

캐나다는 두 개의 주요 통신 네트워크 중 하나가 다운되었을 때를 대비해 장애 조치(페일오버)를 마련할 생각은 하지 못했음이 분명합니다. 유사한 정전 가 불과 1년 전에 발생했습니다. (불쾌감을 느끼신다면 저희가 캐나다에 기반을 두고 있고 비싼 통신 생태계에 지쳤기 때문입니다).

정전으로 인해 많은 IT 담당자가 다음을 수행했습니다. wonder 로저스가 왜 효과적인 장애 조치를 취하지 않았는지 알 수 있습니다. 그렇다면 장애 조치란 정확히 무엇이며, 애플리케이션과 네트워크를 계속 가동하고 실행하는 데 어떻게 도움이 될까요?

알아보세요.

안정적이고 탄력적인 파일 전송

베이크인 페일오버와 끊임없는 재시도를 통한 대용량 파일 전송.

장애 조치란 무엇인가요?

A 장애 조치백업 운영 모드 - 시스템의 주요 구성 요소를 사용할 수 없게 될 때 사용되는 미션 크리티컬 시스템에서 데이터베이스, 서버 또는 네트워크인 경우가 많습니다. 유지보수 중단 시간, 오류 또는 해킹. 장애 복구는 본질적으로 기본 시스템의 기능을 모방하여 언제든지 시스템의 기능을 원활하게 인계할 수 있는 보조 구성 요소입니다.

자동 장애 조치란 무엇인가요?

고가용성이 필요한 애플리케이션 및 웹 서비스의 경우, 예를 들어 자동화된 장애 조치 클러스터 는 백그라운드에서 작동하여 서버에 장애가 발생하더라도 서비스가 계속 실행되도록 하는 서버 그룹입니다.

IT 시스템의 장애 복구는 자동 또는 수동으로 작동하도록 구성할 수 있으며, 일반적으로 전원, 네트워크 연결, 서버 용량이라는 세 가지 주요 요소를 중심으로 이루어집니다.

서버 수준에서 자동화된 장애 복구는 일반적으로 다음을 사용하여 작동합니다. 심장 박동 시스템은 연결된 두 대의 서버를 지속적으로 핑하여 연결이 끊어지지 않는 한 백업이 온라인 상태가 되도록 합니다.

장애 조치 유형:

필요한 가용성 수준에 따라 여러 유형의 네트워크 아키텍처 장애 조치를 구현할 수 있습니다:

  • 콜드 스페어: 콜드 스페어란 사람의 개입이 필요한 수동 페일오버를 말합니다.
  • 핫 스페어/고가용성: 약간의 지연이 있는 자동화된 장애 조치로, 일반적으로 사용자가 장애 조치를 알아차릴 수 있습니다.
  • 완전한 이중화: 즉시 장애 조치 모드로 전환하는 자동 장애 조치.

그러나 수동 장애 복구는 종종 비판 시간이 너무 많이 걸리고 많은 수동 프로세스와 마찬가지로 사람의 실수가 발생하기 쉽기 때문입니다.

그렇기 때문에 고가용성이 필요한 시스템에는 수동 장애 조치가 사용되지 않습니다. 자동 장애 조치 프로세스는 백그라운드에서 실행되며 기본 구성 요소와 백업 구성 요소 간에 데이터를 자동으로 동기화하여 즉시 시스템을 온라인 상태로 유지할 수 있는 기능을 제공합니다.

장애 복구가 중요한 이유는 무엇인가요?

자동화된 장애 복구는 미션 크리티컬 시스템에만 중요한 것이 아니라 절대적으로 필수적입니다. 적절한 페일오버가 없으면 시스템은 중대한 오류가 발생한 후에도 계속 작동하는 데 필요한 이중화 또는 내결함성을 갖추지 못합니다.

자동화된 장애 복구는 다양한 애플리케이션시스템 중단 또는 유지보수 중에 수동 개입 없이 데이터베이스를 온라인 상태로 유지하거나 사람의 감독 없이 유지보수 작업을 실행하는 등의 작업에 사용할 수 있습니다. 이러한 장애 복구는 다음과 같은 다양한 시나리오에도 적용될 수 있습니다:

  • 디바이스: 일부 장치에는 구성 요소에 장애가 발생할 경우 자동 장애 조치를 배포하는 하드웨어 또는 소프트웨어 트리거가 포함되어 있습니다.
  • 네트워크: 네트워크 장애 조치에는 연결 경로 또는 저장 장치와 같은 모든 개별 구성 요소가 포함될 수 있습니다.
  • 호스팅된 데이터베이스 또는 웹 애플리케이션: 장애 조치로 여러 서버(로컬 또는 클라우드 기반)가 연결을 유지할 수 있습니다.

파일 전송을 위한 자동 페일오버

자동 장애 복구가 큰 이점을 제공하는 또 다른 시나리오는 다음과 같은 경우입니다. 파일 보내기. 이 경우 네트워크 장애 발생 시에도 IP 기반 전송을 계속할 수 있는 조항을 마련하는 것이 데이터 흐름을 유지하는 데 중요합니다.

멀티커넥트로 더 많은 인터넷 사용

예를 들어 MASV 자동 페일오버가 구워져 있습니다. 멀티커넥트 채널 본딩. 멀티커넥트는 두 개 이상의 대역폭 소스를 하나의 강력한 네트워크로 통합하여 업로드 및 다운로드 파일 전송 속도를 높입니다(예: 가정용 Wi-Fi와 데이터 핫스팟이 있는 테더링 휴대폰). 각 대역폭 소스는 장애 조치로 간주되며, 하나의 링크가 다운되면 MASV는 나머지 연결에 대해 자동으로 최적화합니다.

자동 재시도

MASV에는 다음과 같은 형태의 복원력 측정도 마련되어 있습니다. 자동 재시도. 네트워크 중단이 발생하면 MASV는 전송이 완료될 때까지 중단된 지점부터 자동으로 재시도합니다. 따라서 사용자는 전송을 기다리거나, 전송이 성공했다고 가정하고 몇 시간 후에 오류 메시지가 표시되는 최악의 상황을 겪을 필요가 없습니다.

장애 조치: 교훈

장애 복구는 일상적인 유지보수, 오류 또는 보안 공격으로 인해 주 시스템이 작동하지 않을 때를 대비한 IT 인프라 운영의 백업입니다. 이는 디바이스, 네트워크, 서버 운영의 주요 구성 요소입니다. 페일오버는 수동 또는 자동으로 수행할 수 있으며, 자동 페일오버는 문제를 감지하는 즉시 백업으로 전환합니다.

캐나다의 대규모 인터넷 셧다운 사태로 인해 많은 사람들이 장애 조치의 개념과 이점에 대해 눈을 뜨게 되었습니다. Rogers의 사장 겸 CEO인 Tony Staffieri는 다음과 같이 다짐했습니다. 중복성 증가 정전 후 3단계 조치 계획의 일환으로 네트워크와 시스템에 장애 조치를 취했습니다. 로저스가 어떤 유형의 장애 조치부터 시행할지에 대해서는 아직 알려지지 않았습니다.

IT 네트워크의 안정성과 복원력을 높이려면 전화와 인터넷에 서로 다른 공급업체를 사용하는 등 통신 포트폴리오를 다양화할 것을 권장합니다. 올인원 전화, 인터넷 및 케이블 요금제는 최고의 가성비를 제공하지만, 한 공급업체에 종속되는 단점도 있습니다(모든 기복이 있는).

파일 전송의 안정성을 높이기 위해 MASV에 내장된 멀티커넥트 장애 복구 기능은 네트워크가 다운되더라도 파일을 계속 전송할 수 있도록 하며, 네트워크가 중단되더라도 끊임없는 재시도 프로토콜이 파일 요청을 계속 전송합니다. 따라서 전국 인터넷 연결의 4분의 1이 다시 다운되더라도, 대용량 파일 전송이 제시간에 도착할 수 있도록 보장할 수 있습니다. 지금 가입하세요 를 클릭하고 20GB를 무료로 받으세요.

MASV 파일 전송

현존하는 가장 빠른 대용량 파일 전송 서비스인 MASV로 20GB를 사용하세요.