클라우드 아카이브: 클라우드 아카이브: 이점, 과제 및 모범 사례

글: | 7월 15, 2024

클라우드 또는 다른 곳에서 호스팅되는 아카이브는 스토리지 백업과 비슷합니다. 하지만 백업과 달리 아카이브는 장기간 보관하고 자주 액세스하지 않는 데이터를 위한 것입니다.

하지만 클라우드 아카이브란 정확히 무엇이며, 데이터를 보관하는 기존 방법과 어떻게 다른가요? 따라야 할 대표적인 클라우드 아카이브 모범 사례에는 어떤 것이 있나요? 저희가 답을 알려드리겠습니다. 지금 바로 시작하세요.

목차

클라우드 아카이브를 위한 빅데이터 수집

중앙 집중식 위치에서 Amazon S3 Glacier와 같은 여러 클라우드 아카이브 솔루션으로 방대한 양의 데이터를 수집하세요.

미디어 또는 기타 데이터를 보관해야 하는 이유는 무엇인가요?

비디오 및 포스트 프로덕션 업체는 종종 데이터 아카이빙을 사용하여 저장 공간을 확보하고 필요할 경우(예: 정보 감사 중 또는 고객이 3년 전 영상을 요청하거나 재해 복구 등) 파일에 계속 액세스할 수 있도록 합니다.

아카이브 스토리지는 콜드 데이터 스토리지라고도 합니다. 동영상 편집자 및 기타 포스트 전문가의 경우, 콜드 스토리지에 데이터를 보관하면 다음과 같이 더 빠르고 응답성이 뛰어난 '핫' 스토리지의 공간을 확보할 수 있습니다. RAID 어레이 또는 네트워크 연결 스토리지 (NAS) 장치.

아카이브에는 보안 문제와 콜드 스토리지에서 데이터를 빼내는 데 많은 비용과 시간이 소요되기 때문에 데이터를 저장하고 액세스할 수 있는 사용자에 대한 엄격한 규칙이 있는 경우가 많습니다.

클라우드 아카이브란 무엇인가요?

A 클라우드 아카이브 는 말 그대로 클라우드에서 호스팅되는 아카이브로, 일반적으로 Amazon S3 오브젝트 스토리지나 Google 클라우드 스토리지와 같은 서비스형 스토리지 퍼블릭 클라우드를 통해 호스팅됩니다. 클라우드 아카이빙은 기업들이 클라우드를 사용할 수 있다는 사실을 알게 된 이후부터 인기를 끌었습니다:

  • 모든 아카이빙 솔루션은 일반적으로 GB당 단 몇 푼의 비용으로 거의 무제한의 규모와 콜드 데이터 스토리지를 제공하며, 아카이브된 데이터를 사내에 보관하는 것보다 훨씬 적은 유지 관리와 걱정 없이 비용 효율적으로 아카이브된 데이터를 저장할 수 있습니다.
  • 값비싼 온프레미스 장비를 구입하고 업그레이드하여 막대한 자본비용(CapEx)을 지출하지 않아도 되며, 해당 장비를 유지, 업데이트 및 패치하는 데 드는 운영비용(OpEx)도 절약할 수 있습니다.

클라우드 이전에는 대부분의 미디어 회사에서 선형 테이프 열기 (LTO), 즉 자기 테이프의 일종으로 아카이브된 데이터를 저장합니다.

클라우드 아카이브와 클라우드 백업 비교

A 클라우드 아카이브 및 클라우드 백업 와 동일하게 들릴 수 있지만 그렇지 않습니다:

  • 백업 에는 정기적으로 새로운 데이터가 복사되고, 데이터 복구가 필요한 경우 비교적 쉽게 액세스할 수 있으며, 프로덕션 데이터가 실시간으로 변화함에 따라 데이터의 변경이 수반되는 경우가 많습니다. 일반적으로 현장(물리적 스토리지에 보관하는 경우) 또는 쉽게 액세스할 수 있는 곳에 보관합니다. 클라우드 스토리지로 변경되며 무기한 보관되지 않습니다.
  • 아카이브 는 데이터를 한 번 오프사이트로 이동한 후 안전한 위치에 무기한 보관합니다. 데이터는 변경되거나 보강되지 않습니다. 아카이브에서 데이터를 내보내는 작업은 종종 시간이 많이 걸리는 프로세스입니다.

클라우드 아카이브와 테이프 아카이브 비교

LTO 테이프는 수년 동안 사용되어 왔으며 모든 미디어 아카이브 담당자들이 전통적으로 사용하는 방식입니다. LTO 테이프 아카이브는 일반적으로 카트리지에 보관된 자기 테이프에 데이터를 저장한 다음 안전한 위치(일반적으로 외부)에 보관합니다.

  • 테이프 라이브러리에서는 수천 개에 달하는 카트리지를 보관하고 회수하기 위해 로봇을 사용하는 경우가 많습니다.
  • 테이프의 제한된 특성으로 인해 데이터가 추가될수록 테이프 라이브러리는 계속 확장됩니다(LTO-7 테이프는 최대 6TB의 데이터를 저장할 수 있다는 점에 주목할 필요가 있습니다).
  • 테이프 라이브러리는 종종 LTFS(선형 테이프 파일 시스템)와 같은 파일 시스템을 통해 구성됩니다.

테이프는 내구성이 강하고 보관 수명이 길며(최대 30년) 디스크에 보관하는 것보다 저렴하기 때문에 아카이빙에 LTO 테이프를 사용하는 경우가 많습니다. 테이프 라이브러리의 단점은 테이프에 특정한 보관 조건 약 70도의 일정한 온도와 40%의 상대 습도를 유지합니다.

플레이스홀더 이미지

출처: 테크타겟

일부 클라우드 콜드 스토리지와 관련된 느린 이그레스 때문에 클라우드 스토리지보다 테이프 라이브러리에서 데이터를 가져오는 것이 더 빠를 수도 있습니다.

하지만 보안, 검색 기능, 중복성, 가동 시간, 편의성이 뛰어나고 비용이 저렴한 클라우드 아카이브 옵션과 비교했을 때 LTO 테이프는 일반적으로 선호도가 떨어졌습니다.

MASV로 데이터 수집 중앙화

MASV는 온프레미스 또는 클라우드에 있는 가장 핫한 스토리지부터 가장 차가운 스토리지까지 연결된 모든 스토리지 대상에 대한 단일 진입점 역할을 합니다.

클라우드 아카이브 관련 과제(및 해결 방법)

클라우드 아카이브를 구현하고 관리하는 데 어려움이 없는 것은 아니지만, 이러한 어려움 중 일부는 사내 클라우드 전문 지식이 부족하여 구성이 잘못될 수 있는 경우가 많습니다.

그리고 잘못된 구성은 비용 증가, 성능 저하, 클라우드 데이터 아카이브로 콘텐츠를 수집하는 효율성에 대한 신뢰 부족으로 이어질 수 있습니다.

클라우드 구성 오류는 어떻게 발생하나요?

일반적으로 클라우드 스토리지의 주요 장점 중 하나는 용량이 사실상 무제한이라는 점이지만, 무제한의 대가는 자칫 잘못하면 낭패를 보기 쉽다는 점입니다. 따라서 클라우드 아카이브를 올바르게 구현하려면 많은 계획과 전략이 필요합니다.

안타깝게도 많은 기업이 계획 단계를 건너뛰고 바로 실행에 옮깁니다.

미디어 클라우드 컨설팅 업체 Tyrell의 클라우드 제품 매니저인 닉 소퍼는 과의 인터뷰에서 "(클라우드를 처음 사용하는 방송사들은) 처음에는 직접 실험하고 시도하는 경우가 많지만, 주말 동안 EC2 인스턴스를 켜두면 비용 부담에 시달리는 경우가 많다"고 말했다. MASV.

결국, 클라우드 아카이빙 서비스에서 배포하는 반짝이는 관리 콘솔에 현혹되어 보안에 대한 잘못된 인식에 빠지기 쉽습니다(조언을 드립니다: 제한된 상황을 제외하고는 콘솔을 사용하지 마세요. 하지만 이에 대해서는 나중에 자세히 설명합니다.)

플레이스홀더 이미지

출처: Amazon

과제 1: 스토리지 비용

일부 클라우드의 잘못된 구성(예: 공용이 액세스할 수 있는 Amazon S3 개체 스토리지 버킷을 그대로 두는 것("새는 버킷"), 주요 사이버 보안 및 데이터 유출 위험으로 이어질 수 있습니다.

그러나 다른 잘못된 구성은 비효율적인 워크플로, 비용 증가, 클라우드 아카이브가 더 비싸다는 오해로 이어질 수 있습니다.

예를 들어, 단 한 번의 잘못된 구성으로 인해 클라우드 비용이 급등할 수 있습니다, 아카이브 스토리지 워크플로우를 특정 버킷이나 경로에 고정하지 않고, 비즈니스 사용자가 현재 데이터를 클라우드 아카이브로 수집할 수 있도록 허용합니다..

콜드 클라우드 스토리지는 일반적으로 핫 스토리지 옵션보다 저렴합니다. 하지만 현재 데이터를 아카이브 스토리지에 저장하면 나중에 해당 데이터에 액세스해야 할 때 매우 높은 송신 수수료가 발생할 수 있습니다.

For Amazon S3예를 들어, 이는 스토리지 등급에 따라 큰 비용 차이를 의미합니다:

스토리지 유형 스토리지 비용(GB당)
S3 표준 $0.021-$0.023
S3 표준 빈번한 액세스 $0.0125
S3 빙하 즉시 검색 $0.004
S3 글레이셔 유연한 검색 $0.0036
S3 글레이셔 딥 아카이브 $0.00099

위에 표시된 바와 같이, 저용량 스토리지 옵션으로 갈수록 GB당 스토리지 비용이 감소합니다.

잘됐네요! 모든 데이터를 콜드 스토리지에 저장해야 한다는 뜻이죠?

잘못된 정보 - 데이터 송신 및 검색 비용은 스토리지가 더 차가울수록 증가합니다:

스토리지 유형 데이터 검색 요청(요청 1,000건당) 데이터 검색(GB당)
S3 표준 N/A N/A
S3 표준 빈번한 액세스 N/A $0.01
S3 빙하 즉시 검색 N/A $0.03
S3 글레이셔 유연한 검색 $0.05-$10 $0.01-$0.03
S3 글레이셔 딥 아카이브 $0.025-$0.10 $0.0025-$0.02

여기서 교훈을 얻으세요: 클라우드 스토리지를 잘못 구성하여 사용자가 현재 데이터를 클라우드 아카이브에 수집하거나 콜드 데이터를 핫 스토리지에 수집하지 않도록 하세요(이 또한 비용이 많이 들 수 있음)..

실제로 아카이브 데이터를 핫 스토리지로 수집하는 것도 비용이 많이 들 수 있습니다(Amazon과 같은 제공업체는 일반적으로 시간 단위로 요금을 청구하므로, 데이터를 빨리 잡아 데이터 아카이브로 옮긴다면 스토리지 비용이 크게 늘어나지 않을 것입니다).

기존 아카이브 스토리지의 숨겨진 비용도 고려해야 할 사항입니다: 테이프를 보관하고, 분류하고, 물리적 공간을 관리하는 데 드는 비용도 추가될 수 있습니다.

과제 2: 성능

특히 사용자가 현재 데이터를 콜드 스토리지에 저장했다가 다시 꺼내야 하는 경우(위의 비용 예시와 유사)에는 잘못된 구성으로 인해 클라우드의 유용성을 성능 중심으로 왜곡된 시각으로 바라볼 수도 있습니다.

콜드 스토리지에서 데이터를 요청할 때 작업을 시작하는 데도 시간이 걸릴 수 있습니다: 먼저 데이터 검색 요청이 처리될 때까지 기다려야 하는데, 보통 몇 시간이 걸립니다.

그런 다음 아카이브에서 데이터를 검색해야 하는데, 이 작업은 말 그대로 며칠이 걸릴 수 있습니다.

비용과 마찬가지로 다음 항목의 처리 시간도 마찬가지입니다. 콜드 스토리지에서 데이터 검색 콜드 스토리지 수준에 따라 크게 달라집니다:

스토리지 유형 데이터 검색 처리 시간
S3 표준 밀리초
S3 빙하 즉시 검색 밀리초
S3 글레이셔 유연한 검색 1-5분(신속), 3-5시간(일괄), 5-12시간(대량)
S3 글레이셔 딥 아카이브 12-48시간

Amazon과 같은 클라우드 제공업체는 실수에 대해 매우 관대할 수 있지만, 지금 당장 필요한 중요한 비즈니스 데이터를 Glacier Deep Archive에 보관하고 싶지는 않다고 가정해 보겠습니다.

💡 데이터 검색에 허용되는 처리 시간은 데이터의 종류와 사용 사례에 따라 다릅니다. 경우에 따라서는 유연한 검색 옵션이 가장 좋을 수도 있습니다.

과제 3: 관리 콘솔/포털

지금 바로 말씀드리겠습니다: AWS 관리 콘솔, Azure 포털 또는 Google Cloud 콘솔과 같은 관리 콘솔 또는 포털을 사용하여 클라우드 서비스를 관리하고 있다면, 아마도 잘못하고 있는 것일 수 있습니다..

대형 퍼블릭 클라우드 제공업체의 관리 콘솔은 일반적으로 보기에도 좋고 신규 사용자도 쉽게 적응할 수 있도록 설계되어 있습니다: 대부분의 경우 몇 가지 상자를 체크하기만 하면 시스템 구성이 완료됩니다.

  • 문제는 이러한 상자에 체크하는 것은 매우 쉬우며, 잘못된 상자를 선택하면 처음에는 분명하지 않을 수 있지만 시간이 지나면서 엄청난 양의 문제를 일으킬 수 있는 연쇄적인 부정적인 영향을 미칠 수 있다는 것입니다.
  • 많은 콘솔은 혼란스럽고 모듈 간 규칙이 일관되지 않아 특정 변경 사항이 시스템의 나머지 부분에 미치는 영향을 완전히 이해하는 것이 거의 불가능할 수 있습니다.
  • 또한 구성이 잘못되었을 경우 공동 작업자가 어떤 작업이 수행되었는지 확인하기가 매우 어렵습니다.

이러한 이유로 퍼블릭 클라우드 제공업체의 관리 콘솔을 사용하여 프로덕션에 배포하지 않는 것이 좋습니다.. 콘솔은 좋은 출발점이 될 수 있고 도움이 될 수 있지만 장기적으로 성공할 수 있도록 도와주지는 않습니다.

IaC(인프라를 코드로 사용)를 사용하거나 명령줄 도구를 사용하여 배포하는 것이 훨씬 덜 위험하고 효과적입니다. 이 접근 방식에는 몇 가지 장점이 있습니다:

  • 검토 프로세스가 있습니다.에서 변경하려는 모든 내용을 다른 팀원에게 공개할 수 있습니다. 검토 규칙을 적용하여 다른 사람이 먼저 검토하지 않으면 변경 사항을 배포할 수 없도록 할 수 있습니다.
  • 규칙을 설정할 수도 있습니다. S3 버킷을 공개로 설정할 수 없도록 하는 등 성능과 보안에 관한 규칙을 설정할 수 있습니다. S3 버킷을 공개로 설정할 수 없도록 하는 등의 규칙을 설정할 수 있는 자동화된 검색 도구.

IaC 또는 명령줄을 사용하여 클라우드 아키텍처를 설정하고 관리하려면 설정하는 데 많은 구성, 시간, 비용이 소요될 수 있습니다. 하지만 장점은 비용, 취약성, 불필요한 실수로 인한 피해를 크게 줄일 수 있다는 점입니다.

클라우드 아카이브 구현 및 관리하기: 모범 사례

클라우드 아카이브를 구현할 때 염두에 두어야 할 두 가지 주요 사항이 있습니다:

  • 스토리지 수집 경로를 구성하여 적절한 사람이나 애플리케이션이 다음과 같이 액세스할 수 있도록 하세요. 올바른 스토리지.
  • 수집된 모든 데이터가 자동으로 올바른 스토리지 버킷으로 이동하도록 데이터를 적절히 분류하세요.

다음은 클라우드 아카이브 설정을 위한 몇 가지 다른 팁입니다:

  1. 핫 스토리지로 연기: 원칙적으로 모든 데이터를 먼저 핫 스토리지에 저장하는 것이 좋습니다.
  2. 콜드 스토리지로 데이터 자동화: 일정 기간이 지나면 데이터를 재분류하여 콜드 스토리지로 옮기는 자동화된 시스템을 설정하세요(턴키 솔루션을 구입하거나 자체 규칙을 구축할 수 있습니다). 이 과정만으로는 비용이 많이 드는 실수를 저지르기가 훨씬 더 어렵습니다. 클라우드 스토리지와 통합되는 데이터 업로드/파일 전송 도구를 사용한 다음, 클라우드 스토리지 플랫폼 내에서 아카이브 관련 규칙을 구성할 수 있습니다(예: X일 후 액세스하지 않은 데이터 아카이브).
  3. PoC 전용 콘솔 사용: 샌드박스 계정에서만 개념 증명용으로 관리 콘솔을 사용하세요(해당 계정의 비용을 매우 주의 깊게 모니터링하세요). PoC가 완료되면 IaC 또는 명령줄을 사용하여 프로덕션에 배포하세요. 프로덕션 환경에서 웹 콘솔을 사용하다가 실수를 하는 경우 클릭한 모든 내용을 기억해 두어야 문제를 재현할 수 있습니다. 명령줄 도구는 잘못된 명령을 입력하면 작업이 작동하지 않기 때문에 위의 시나리오를 방지합니다.
  4. 권한 있는 액세스에 인색해지기: IT 관리자는 아카이브할 데이터를 저장해야 하는 비즈니스 사용자 또는 기능에만 스토리지에 대한 권한 있는 액세스 권한을 부여해야 합니다.

MASV로 클라우드 아카이브에 데이터를 손쉽게 수집하기

다른 클라우드 스토리지와 함께 클라우드 아카이브를 설정하고 관리하려면 많은 작업이 필요하고 프런트엔드에 많은 시간을 투자해야 합니다.

하지만 그 모든 시간과 노력은 데이터 아카이빙 프로세스를 체계적으로 고려했음을 의미하며, 이는 곧 잘못된 구성과 비용이 많이 드는 오류를 줄일 수 있다는 것을 의미하므로 그만한 가치가 있습니다.

반면, 핫 스토리지에서 아카이브에 이르기까지 여러 스토리지 대상과 공유 액세스를 관리하는 것은 시스템 보안을 처리하는 동시에 여러 스토리지 플랫폼과 사용자 권한을 관리해야 하는 IT 팀에게는 관리의 악몽으로 바뀔 수 있습니다. 하지만 MASV 중앙 집중식 수집 를 사용하면 모든 클라우드 스토리지에서 데이터 수집 프로세스를 간소화하는 동시에 보안을 강화할 수 있습니다.

중앙 집중식 수집은 스토리지 플랫폼 수준에서 여러 사용자와 권한을 관리할 필요 없이 스토리지로 데이터 수집을 연결, 관리, 자동화할 수 있는 허브입니다. IT 관리자는 MASV의 브라우저 인터페이스를 통해 클라우드 아카이브와 같은 공유 스토리지를 쉽게 연결한 다음, 모든 클라우드 스토리지에 대한 중앙 집중식 보안 자동 게이트웨이 내에서 수집 액세스를 손쉽게 구성할 수 있습니다: MASV. 그런 다음 프로젝트 팀은 MASV를 사용하여 미디어를 공유 스토리지로 자동화할 수 있습니다. 사용자 친화적인 업로드 포털를 통해 생산성을 높이고 관리를 간소화할 수 있습니다.

MASV에 가입하기 오늘 무료로 이용하세요.

백업 및 아카이브 스토리지 워크플로 자동화

MASV는 수십 개의 클라우드 플랫폼과 통합되어 대용량 미디어의 저장을 자동화할 수 있습니다.