간단히 말해 인터넷이 코로나19 팬데믹으로 유발된 갑작스러운 트래픽 폭증에도 견딜 수 있는 것은 인터넷 백본을 구성하는 인프라가 이런 비상 사태에도 살아남을 수 있도록 설계되었기 때문이다.
탄생 50주년을 몇 개월 앞둔 시점에 인터넷은 그 유연성과 생존 가능성을 여실히 증명했다.
코로나19 확산을 억제하기 위해 재택근무를 추진하는 민간기업과 공공기관, 정부기관으로부터 쏟아져 들어오는 전 세계적인 트래픽 폭증에 직면해 일부 전문가는 대역폭에 대한 맹공으로 인터넷이 주저앉지는 않을지 우려하기도 했다. 핫스팟이 여러 곳 있지만, 모든 징후는 인터넷 인프라가 지금까지는 잘 유지되고 있어서 이 가혹한 상황에서 한 줄기 희망의 빛이 되고 있다.
트래픽이 몇 배나 증가했다는 증거는 많다.
버라이즌의 공공 사업부 담당 수석 부사장 안드레스 일란도는 버라이즌 네트워크 상의 비디오가 41%, VPN 사용률이 65% 증가했으며, 협업 툴 사용률은 10배나 증가했다고 밝혔다.
콕스 커뮤니케이션 CTO 케빈 하트에 따르면, 지난 두 달 동안 다운스트림 트래픽이 최대 20%, 업스트림 트래픽이 최대 40% 증가했다. 하트는 “트래픽 증가에 대응하기 위해 수요 곡선보다 12~18개월 앞서는 장기 계획을 실행하고 있다. 이런 상태를 유지하느라 애를 쓰기는 했지만, 99%의 노드가 모두 정상적인 상태이다”라고 설명했다.
독일 프랑크푸르트에 있는 DE-CIX(Deutsche Commercial Internet Exchange)는 3월 초 데이터 입출력 기록을 세웠는데, 9.1Tbps 이상이었다. DE-ICX는 IX에서 피크 타임에 이렇게 많은 데이터가 오간 적은 없다고 밝혔다.
그렇다면, 인터넷은 어떻게 이런 상황을 처리하는 것일까?
먼저 인터넷이 어떤 모습인지 생각해야 한다. 인터넷은 각각의 연결된 디바이스에서 고대역폭 라우터로 트래픽을 옮기는 액세스 링크로 구성된다.
이들 라우터는 TCP/IP를 사용해 출발지에서 목적지까지 최적의 경로로 트래픽을 전달한다. 트래픽이 통과하는 코어 네트워크는 각각의 고속 광 네트워크로 구성되며, 이런 광 네트워크가 서로서로 대등하게 연결되어(피어링, peering) 인터넷 백본을 만든다.
개별 코어 네트워크는 1계층 ISP(Internet Service Provider)와 대형 통신업체의 사유 자산이다. 이들 네트워크는 서로 밀접하게 연결되어 있는데, AT&T, 도이치 텔레콤, NTT, KT, 스프린트, 타타 커뮤니케이션 등이다.
백본 ISP는 피어링 포인트에서 서로의 네트워크를 연결하는데, 피어링 포인트는 중립적인 소유의 시설로, 고속 스위치와 라우터가 피어 간의 트래픽을 전달한다. 피어링 포인트는 서드파티, 또는 비영리 단체가 소유하기도 하는데, 이런 식으로 백본의 통일을 돕는다.
백본 인프라는 초고속 라우터에 의존하는데, 100Gbps 속도를 제공한다. 인터넷 장비는 시스코나 익스트림, 화웨이, 주니퍼, 노키아 등 다양한 네트워킹 솔루션 업체가 만든다.
시스코는 아시아와 유럽, 아메리카 대륙에 걸쳐 주요 통신업체의 트래픽 통계를 분석해 왔는데, 시스코의 데이터는 네트워크에서 가장 혼잡한 지점은 보통 ISP 간의 피어링 포인트에서 일어난다는 것을 보여준다. 시스코의 대규모 인프라 그룹 총괄 책임자인 조나선 데이비슨은 3월 26일 블로그를 통해 “이들 지점의 분석은 트래픽이 정상 수준보다 10~41% 증가했음을 보여준다.
모든 국가에서 필수적이지 않은 비즈니스를 중단하고 외출을 금지하면서 트래픽이 폭증했다. 홍콩, 이탈리아, 프랑스, 러시아의 피어링 포인트가 가장 큰 폭의 트래픽 증가를 기록했다. 이후 트래픽은 안정화되거나 날이 갈수록 조금씩 증가하는 추세를 보인다”고 밝혔다.
전체적인 흐름은 긍정적이지만, 상황이 완벽한 것은 아니다. 사우전드아이즈(ThousandEyes)의 트래픽 모니터링 전문가에 따르면, 다양한 서비스 중단 사태가 일어났다. 사우전드아이즈는 매주 ISP와 클라우드 서비스 업체, 화상회의 서비스 간의 서비스 중단에 대한 보고서를 발행한다. 4월 20~26일 기간에 전 세계적으로 ISP의 서비스 중단은 250건을 기록했으며, 미국 내에서는 124건이 발생했다.
지난 3월말 이후 최고치이긴 하지만, 당시는 센추리링크(CenturyLink) 네트워크의 광 케이블 절단 사고와 타타 커뮤니케이션의 사고가 이례적인 영향을 미친 기간이었다. 보통 이런 문제는 과도한 트래픽 때문에 발생하지 않는다.
설계 단계에서 구현하는 복원성
네트워크 계획과 트래픽 엔지니어링, 첨단 장비는 필요에 맞춰 그때그때 조정하는 인터넷의 역량에서 가장 큰 역할을 한다. 데이비슨은 “IP는 어떤 재난에도 살아남을 수 있도록 만들어졌으며, 코어 네트워크는 거의 모든 것을 견딜 수 있다”며, “이 거대한 네트워크를 구축하는 데 오랜 세월에 걸쳐 엄청난 규모의 투자가 이루어졌다. 지금은 서부 시대가 아니다. 인터넷은 치명적인 자원이며, 기대치는 그 어느 때보다 높다”고 강조했다.
실제로 과용량 구축의 원칙은 인터넷이 그토록 잘 버티는 핵심 이유 중 하나이다. 버라이즌의 일란도는 “네트워크 용량이 무엇보다 중요하다. 우리 네트워크팀과 엔지니어는 이번 위기에도 네트워크 용량이나 여분을 동일하게 유지할 수 있었다”라며, “우리는 앞으로도 계속 용량과 연결성을 강화해 나갈 것이다”라고 설명했다.
센추리링크의 CTO 앤드류 듀건은 “처음에 트래픽이 폭증하면서 걱정하는 사람도 있었다. 센추리링크의 인터넷 트래픽은 35%가 증가했지만, 궁극적으로 네트워크는 이런 트래픽을 꽤 잘 처리해냈다”라고 말했다. 인터넷 계획에는 실제로 팬데믹이 발생했을 때의 수요도 계산되어 있다. 듀건은 “센추리링크와 여러 서비스 업체는 10년도 더 전에 팬데믹 계획을 개발하기 시작했고, 대응책의 일부가 우리 인프라에 크게 의존할 것이란 사실을 잘 알고 있다”고 덧붙였다.
대규모 IP 네트워크를 구축하는 사람은 예기치 못한 정체에 맞춰 네트워크를 설계한다. 듀건은 인터넷이 갑작스러운 트래픽 증가를 성공적으로 지원하는 데 도움이 된 요소 세 가지를 소개했다.
네트워크는 광 케이블 절단과 장비 고장을 처리할 수 있는 리던던시를 갖추도록 구축된다. 이는 갑작스러운 재해를 지원할 수 있는 여분의 용량이 있음을 의미한다.
네트워크 모니터링은 어디에서 정체가 발생할지 예측할 수 있도록 해주며, 운영자는 트래픽을 정체가 적은 경로로 옮길 수 있다.
ISP는 수년 동안 증가하는 수요에 맞춰 네트워크를 구축하고 있으며, 계획 사양은 네트워크가 용량의 한계에 도달하지 않도록 한다.
광 백본 네트워크를 구축할 때, ISP는 태풍이나 지상 전력선을 손상할 수 있는 사고로부터 보호하기 위해 종종 케이블을 땅속에 매설한다. 이 때문에 광 케이블 배치 비용의 많은 부분이 도랑을 파는 인건비이며, 일단 도랑을 판 이후에는 현재 필요한 용량보다 훨씬 많은 케이블을 설치한다. 다크 파이버(Dark Fiber)라 부르는 이 광케이블 용량은 추가 케이블이나 사용하지 않는 광 케이블의 형태로 있지만, 필요할 때는 광 스위치가 즉각 켜서 사용할 수 있다.
듀건은 코로나19가 센추리링크 네트워크에 미친 영향에 관해 “일부 인프라 영역의 트래픽이 증가했다. 하지만 우리 네트워크는 광 케이블 기반이라 금방 용량을 추가할 수 있었다”라고 설명했다. 또 ISP는 항상 더 많은 광 케이블을 추가하고 있는데, “이는 네트워크가 날로 증가하는 수요를 만족하고 이번과 같은 위기 상황을 지원하도록 보장하는 핵심”이라고 강조했다.
라스트 마일의 변화
광 케이블은 대규모 인터넷 백본에서는 흔하지만, 각 가정을 연결하는 라스트 마일 구간에서는 보기 힘들다. 브로드밴드나우(BroadbandNow)에 따르면, 광 케이블이 지금까지 가장 빠른 가정용 인터넷 연결 옵션이긴 하지만, 사용할 수 있는 지역은 미국 전역에 흩어져 있다. 광 케이블의 비싼 설치 비용 때문에 주요 도시에서도 ISP 접속은 여전히 동축 케이블 TV 서비스가 지배적이다. 예를 들어, 시카고는 2020년 현재 광 케이블 서비스를 이용할 수 있는 가정은 21%에 불과하다. 달라스는 약 61%인데, 미국 내 다른 주요 대도시와 비교해 상당히 높은 수준이다.
지난 3월 재택근무 조치가 내려졌을 때, 인터넷 트래픽의 근원지가 극적으로 변했다. 고속 링크와 연결된 기업 사이트에서 나오는 것이 아니라 갑자기 상당한 양의 트래픽이 일반 가정에서 나오면서 더 많은 트래픽이 액세스 네트워크에 더해졌다.
이는 AT&T CEO 랜달 스티븐슨이 1분기 실적 발표회의를 할 때 언급할 정도로 상당한 문제였다. 당시 스티븐슨은 “상당한 규모의 네트워크 사용이 도심을 벗어난 교외 지역에서 나오고, 많고 많은 트래픽이 가정에서 나오고 있다”고 말했다. 재택근무 중인 직원과 온라인 과제를 하는 학생, 그리고 온라인 쇼핑이 이런 네트워크 부하에 더해졌다.
하지만 센추리링크의 듀건은 재택근무 활동은 보통 낮 시간 동안 일어나지만, 인터넷 사용 최고조는 저녁 시간 사람들이 비디오와 게임을 즐기면서 일어났다고 지적했다. 이는 추가 인터넷 사용이 균형을 이루는 데 일조했다.
여기에 더해 트래픽 엔지니어링도 트래픽이 너무 몰릴 때는 네트워크 경로의 혼잡을 해소하는 데 도움이 된다. 이 마저도 여의치 않은 서비스 업체는 다른 방안을 찾아야 한다. 예를 들어, U.S. 셀룰러는 다른 통신업체로부터 무선 대역을 빌려서 모바일 브로드밴드 용량을 보강했다.
AI와 자동화로 문제 발생 방지
이외에도 인터넷 성능을 유지하는 데 도움이 되는 속성은 많다. 예를 들어, AT&T는 문제가 생긴 고객 장비의 원격 트러블슈팅과 문제가 발생하기 전에 징조를 파악하는 데 AI를 사용하고 있다고 밝혔다. AT&T는 “특정 시장에서 새로운 AI 기능의 배치를 촉진해 특정 지역 내, 지역 간 트래픽 부하의 균형을 맞추어 특정 셀의 과부하를 방지하고 사용자 경험을 개선했다”고 밝혔다.
자동화의 증가도 네트워크 엔지니어가 좀 더 신속하게 트래픽을 관리하는 데 영향을 미쳤다. 듀건은 “코로나19 사태 이전에 소프트웨어 정의 네트워킹에 우선적으로 투자한 통신 서비스 업체는 레거시 네트워크나 하이브리드 네트워크를 사용하는 곳보다 트래픽 패턴의 변화에 좀 더 잘 대응할 수 있었다”라고 설명했다.
한 걸음 더 나아가 버라이즌의 일란도는 현재의 인터넷 트래픽 수준이 뉴 노멀은 아니라며, “미래는 아무도 알 수 없다. 하지만 90%이 미국인이 재택근무를 하지는 않을 것”이라고 지적했다.
원격 근무의 영향을 보여주는 또 하나의 징후는 가트너가 지난 3월 317명의 CFO를 대상으로 실시한 설문 조사 결과이다. 이 조사에서 응답자의 74%는 코로나19 이후 기존의 사무실 근무 인력 중 최소한 5%는 영구적으로 재택근무로 전환할 것이라고 답했다.
콕스 커뮤니케이션의 하트는 이런 상황이 백본에 지속적으로 투자해야 할 필요성을 과소평가하고 있다고 평가했다. 하트는 콕스가 향후 5년간 네트워크 용량 구축과 액세스 개선, 고속 저지연 보안 네트워크 강화에 100억 달러를 투자할 것이라고 강조했다.
<출처 : IT WORLD>