Tech News2007. 11. 30. 03:00

1. 3차 세계대전 직전까지 갔던 소련 조기 경보 시스템 오류(1983)
컴퓨터가 의도적으로 3차 세계대전을 일으킬 수 있다는 주장은 아직까지는 공상과학 분야의 소재일 뿐이지만, 과거에 우발적인 소프트웨어 결함으로 그런 상황에 거의 근접했던 적이 있다. 소문에 떠도는 이런 종류의 사건들은 무수히 많지만, 군사 시스템은 철저하게 은폐되어 있어서 떠도는 소문과 실제 사건을 구분하기가 매우 어렵다.

하지만 지난 1983년에 일어난 한 사건은 명확하게 기록으로 남아 있으며 소련 조기 경보 시스템의 소프트웨어 버그로 인한 직접적인 결과였다.

소 련의 그 시스템은 미국이 다섯 대의 탄도 미사일을 발사했다고 경보를 울렸다. 하지만 그 시스템 담당 장교였던 스타니슬라프 페트로프 중령은 “…문득 웃긴다는 느낌”이 들었고 미국이 실제로 공격을 하는 것이라면 미사일을 다섯 대 밖에 발사하지 않았을 것이라는 생각을 하게 되었다.

묵시록의 재앙에 거의 근접하는 대참사를 시작하게 만든 요인을 추적한 결과, 구름 위에서 반사되는 햇볕을 위성이 포착해 미사일로 잘못 오인하는 상황을 걸러내게 되어 있는 소프트웨어의 오류로 밝혀졌다.

2. AT&T 전화망 마비(1990)
1990 년에 AT&T의 114 교환 센터의 교환기 한 대가 사소한 기계적인 문제를 겪은 후 가동이 중지되어 미국 전역에서 전화를 걸어도 받지 않는 상황이 7,500만통이나 발생했다. 곧 복구된 그 교환 센터는 다른 센터로 메시지를 보냈고, 그 다른 센터들도 차례로 오류를 발생하고 가동을 중지했다가 리셋이 되었다.

범인은 (당시 일부 사람들의 주장처럼 해커가 아니라) 매우 복잡한 소프트웨어 업그레이드 중에 추가된 한 줄의 코드에 포함된 오류인 것으로 밝혀졌다. 아메리칸 에어라인은 이 사건으로 20만건의 예약을 받지 못하는 피해를 입었다고 추정했다.

3. 아리안5 폭발(1996)
1996년에 유럽의 당시 최신 무인 위성 발사 로켓인 아리안 5호가 프랑스령 기아나의 쿠루에서 첫 비행을 시작한 후 단 몇 초 후에 갑자기 폭파되었다.

유 럽 우주국(European Space Agency)은 아리안 5호의 총 개발비를 80억달러로 추산했다. 아리안 5호에는 지구의 자기장이 태양풍과 어떤 작용을 하는지를 연구하기 위해 만든 4대의 과학 위성(5억 달러)이 탑재되어 있었다.

뉴욕타임스의 기사에 의하면 그 폭발은 소프트웨어가 ‘64비트 숫자를 16비트 공간에’ 채우면서 유발된 것이었다.

“이 가동 중지는 발사 후 36.7초 지난 시점, 즉 유도 시스템의 자체 컴퓨터가 일부 데이터(로켓의 측방향 속도)를 64비트 포맷에서 16비트 포맷으로 변환하려고 하면서 발생했다. 이 숫자가 너무 커서 오버플로 오류가 발생한 것이었다. 유도 시스템이 가동을 중지하면서 그런 고장이 발생할 때를 대비해 배치되어 있던 동일한 종류의 장애 대비 장치로 제어권이 넘어갔다. 하지만 그 장치도 몇 밀리초 만에 동일한 방식으로 장애 상태가 되었다. 왜 그렇게 되었는가? 동일한 소프트웨어를 실행하고 있었기 때문이다”라고 그 기사는 분석했다.

4. 소프트웨어 호환 문제로 발생한 에어버스 A380 사건(2006)
2006 년에 발생한 에어버스A380 사건은 많은 기업이 소프트웨어로 인해 겪을 수 있는 문제, 즉 프로그램 사이에 대화가 되지 않을 때 발생하는 문제를 잘 보여준다. 이 경우 문제의 원인은 세계에서 가장 큰 항공기 중 하나인 에어버스A380을 설계하고 조립하는 데 사용된 CATIA 소프트웨어를 구성하는 두 부분이었다.

비즈니스위크 지에 의하면 유럽의 주요 사업 중 하나였던 이 사업에서 발생한 문제는 그룹 내의 두 계열사, 즉 프랑스 다소 항공(Dassault Aviation)과 독일 함부르크 공장 사이의 의사소통과 관련이 있었다.

간 단하게 말해서 독일 시스템은 구 버전 CATIA를 사용했고 프랑스 시스템은 최신 버전을 사용했다. 따라서 에어버스가 항공기의 두 부분을 조립하려고 하자 소프트웨어 차이로 인해 한쪽의 배선이 다른 쪽의 배선과 맞지 않는 상황이 벌어졌다. 결국 케이블 배선을 다시 해야 했다.

이 문제는 결국 시정되었지만 정확한 금액을 알고 싶어하는 사람이 없을 정도의 피해를 입었다. 하지만 많은 대가를 치러야 했다는 것은 분명했으며, 프로젝트는 1년 이상 지연되었다.

5. 화성 기후 탐사선 미터법 문제(1998)
화성 기후탐사선과 화성 극지착륙선은 1998년에 화성의 날씨, 기후, 그리고 대기 중의 물과 이산화탄소 함량 등을 연구하려는 우주 프로그램의 일부였다. 하지만 비행 오류로 인해 착륙선이 대기 중에서 너무 낮게 날다가 파괴되는 일이 있었다.

오류가 생긴 원인은 무엇이었는가? 미 항공우주국(NASA) 프로그램을 제작한 하청업체에서 (유럽에서 사용하는) NASA 지정 미터법 단위가 아니라 (미국에서 사용하는) 법정 단위를 사용했기 때문이었다.

6. EDS와 영국 아동지원청(2004)
비즈니스 서비스 분야의 대기업인 EDS는 이 재난으로 인해 심한 고난을 겪었다. 이 사건으로 인해 아동지원청(CSA)이 해체되었고 영국 납세자들의 혈세가 10억파운드 이상 낭비되었다.

어떻게 된 일인지 EDS의 CS2 컴퓨터 시스템은 190만명의 사람들에게는 초과 지급했고 70만명 정도에게는 적게 지급했다. 영 노동연금부(DWP)가 CS2를 도입하면서 동시에 CSA를 개선하기로 결정한 것도 원인의 일부였다.

공공자금 결산 위원회 의장인 에드워드 레이는 감사원이 결국 수습에 나섰을 때 이렇게 분노를 터뜨렸다.

“그 렇게 많은 경고를 무시하고, DWP, CSA 그리고 IT 하청업체인 EDS는 조직을 재구성하면서 동시에 거대하고 복잡한 IT 시스템을 도입했다. 낮이 지나면 당연히 밤이 오듯 이 새로 도입된 새 시스템은 문제를 일으켰고 지금은 운영하기 어려울 정도의 어마어마한 문제를 안고 있다”.

7. 2000년 연도 표기 문제(1999/2000)
많은 IT 벤더들과 하청업체들이 소위 말하는 밀레니엄 버그와 관련된 참사를 피하기 위해 수십억달러를 쏟아 부었다. 천문학적인 계약금과 의뢰비를 주었다는 소문이 무성했다.

지구 자전에 맞추어 시간대마다 차례대로 밤12시가 되었지만, 패닉 상태는 오지 않았고 충돌을 일으키는 컴퓨터 시스템도 없었다. 그냥 새해가 밝았을 뿐이었다.

그 일을 여기 포함시킨 이유는 무엇인가? 재난이 발생할 것이라는 예측이 틀렸다는 것은 문제가 아니다. 대책을 세워 막은 재난을 막은 것일 수 있기 때문이다.

문 제는 컴퓨터 프로그램의 날짜 필드에 두 자리 숫자를 사용하기로 한 원래의 결정, 그리고 그것을 꼭 필요한 이상 오래 동안 계속 사용하기로 한 원래의 결정으로 인해 그 많은 손실이 발생했다는 점이다. 영 하원 도서관의 보고서에는 밀레니엄 버그 수정 비용이 8,286억달러로 기록되어 있다. 그렇기 때문에 밀레니엄 버그야말로 10대 재난에 낄 자격이 있다.

8. 랩톱 폭발 사고(2006)
델 이 제조한 랩톱이 일본에서 열린 한 산업 박람회에서 불꽃을 일으키며 폭발한 것은 사실 아주 단순한 원인에 의한 것이지만 분명히 조용한 사고는 아니었다. 랩톱에 불이 붙었다는 소문은 있었지만 델의 랩톱이 언론의 관심이 집중된 곳에서 총천연색 동영상으로 찍히면서 그렇게 되었다는 점에서 분명히 차이는 있었다.

델의 대변인인 안느 캠든은 그 당시 “해당 노트북을 확보했으며 그 사건을 조사하기 시작했다”고 발표했으며, 실제로 델은 조사를 했다. 조사 결과 문제의 원인은 배터리/전원공급장치가 과열되어 불이 붙은 것으로 밝혀졌다.

그로 인해 델은 값비싼 대가를 치르게 되었다. 조사가 끝난 후 델은 410만개의 랩톱 배터리를 리콜해 교체해 주는 것이 현명하다고 결정했다.

이 회사의 최고 경영자인 마이클 델은 결국 배터리 고장에 대해 배터리 제조사인 소니를 비난했다. 하지만 그것이 끝이 아니었다. 애플은 아이팟과 맥북에서도 문제가 있었다고 보고했고 많은 PC 공급업체들도 동일한 문제를 보고했다. 마쓰시타만 해도 약 5,400만대의 장치를 리콜해야 했다. 소니는 그 당시 애플과 델의 리콜 프로그램을 지원하는 총 비용이 200~300억엔(1,700~2,600억원)이라고 추산했다.

9. 지멘스와 여권 시스템(1999)
1999년 여름에 50만명의 영국 시민들은 신규 여권을 제때 발급받지 못해 불편을 겪었다. 여권국이 지멘스 컴퓨터 시스템을 새로 들여오면서 충분히 테스트를 하지도 않고 먼저 직원들을 교육하지도 않았기 때문이었다.

수백명의 사람들이 휴가를 망쳤으며 내무성은 수백만파운드를 보상금으로 지불해야 했으며 직원들은 초과 근무를 해야 했다. 그리고 여권을 받기 위해 빗속에서 기다리는 불쌍한 사람들을 위해 우산도 제공해야 했다.

하지만 여권 신청이 예기치 못할 정도로 그렇게 많았던 이유는 무엇인가? 법이 개정되면서 사상 처음으로 16세 이하의 모든 자녀들이 해외여행을 하려면 여권을 받아야 한다고 요구했기 때문이었다.

보 수당의 안느 위드콤 의원은 그 상황에 대해 당시 내무부 장관인 잭 스트로를 호되게 나무라면서 이렇게 요약했다. “그가 상식이 있었다면 아동 여권법을 개정하면서 동시에 담당 기관의 컴퓨터 시스템을 새로 도입하게 되면 나중에 문제가 심각해진다는 정도는 당연히 알았어야 한다”.

10. LA 공항 이륙 불가 사건(2007)
올해 초 소프트웨어 문제로 로스앤젤레스 국제공항에 약 1만7,000대의 비행기가 이륙하지 못하는 일이 있었다. 미국 세관 및 국경보호국의 시스템에 발행한 문제는 한 대의 평범한 싸구려 장비로 인해 생긴 간단한 것이었다.

문 제의 장치는 네트워크 카드였다. 그 카드는 완료가 되면 작동을 정지하는 것이 아니라 잘못된 정보를 네트워크를 통해 계속 보냈다. 그 데이터는 계속 전달되어 결국 USCBP 네트워크 전체를 마비시켜 버렸다. 그 결과 여덟 시간 동안 아무도 공항을 통해 미국으로 들어오거나 나가지 못했다. 승객들은 많은 불편을 겪어야만 했다.

[출처: http://blog.daum.net/i3biz-hs11/13477652]

Posted by KudoKun