NASA, 우주 방사선에도 끄떡없는 내결함성 컴퓨터 설계 비법 공개

by DD
1개월 전
조회수 22

NASA는 아르테미스 II(Artemis II) 임무를 위해 내결함성 컴퓨터(Fault-Tolerant Computer)를 구축, 시스템의 안정성을 확보함

8개의 CPU를 병렬로 실행하며, 'Fail-Silent' 설계를 통해 오류 발생 시 즉각적인 감지 및 대응이 가능하도록 함

다중화(Redundancy)를 통해 하드웨어 고장에 대비하며, 논리적 네트워크 평면 및 비행 컴퓨터의 중복성을 확보함

댓글에서는 하드웨어 세부 정보 부족에 대한 아쉬움과 함께, 우주 환경에서의 하드웨어 고장 및 방사선 영향에 대한 궁금증을 제기함

Fail-Silent 설계(Fail-Silent Design)의 핵심

아르테미스 II(Artemis II)의 컴퓨터는 'Fail-Silent' 설계(Fail-Silent Design)를 기반으로, 오류 발생 시 잘못된 결과를 전송하는 대신 시스템을 정지시킨다. 이는 CPU의 오류를 즉시 감지하고, 우선순위 기반의 소스 선택 알고리즘을 통해 결과 비교(Result Comparison)의 복잡성을 줄인다. 댓글에서는 두 CPU가 동시에 오류를 발생시키는 경우에 대한 추가적인 설명이 필요하다는 의견이 제시되었다.

다중화(Redundancy) 아키텍처 분석

NASA는 하드웨어 고장을 대비하기 위해 다중화(Redundancy)를 적극적으로 활용한다. 물리적으로 중복된 배선과 논리적으로 중복된 네트워크 평면, 그리고 중복된 비행 컴퓨터를 통해 시스템의 가용성을 극대화한다. 댓글에서는 임무 수행 중 다중화 활용률(Redundancy Utilization)에 대한 시각적인 데이터 공개를 기대하며, 우주 환경에서의 하드웨어 내구성(Hardware Durability)에 대한 관심을 보였다.

안전 필수 시스템(Safety-Critical System)의 기술적 특징

아르테미스 II(Artemis II)의 컴퓨터는 ARINC 스케줄러(ARINC Scheduler), 실시간 운영체제(RTOS), 그리고 다중화 기술을 활용하여 안전 필수 시스템(Safety-Critical System)의 요구 사항을 충족한다. 댓글에서는 ARINC 스케줄러(ARINC Scheduler)의 오랜 사용 역사와 함께, INTEGRITY-178BLynxOS-178B와 같은 마이크로커널(Microkernel) 기반의 시스템과의 연관성을 언급하며, 방사선 내성(Radiation Hardening) 기술에 대한 혁신에 대한 궁금증을 나타냈다.

우주 환경에서의 하드웨어 문제점

댓글에서는 우주 환경에서 발생하는 하드웨어 고장(Hardware Failure)방사선(Radiation)의 영향에 대한 질문이 제기되었다. 특히, 방사선이 비트 플립(Bit Flip)을 얼마나 자주 발생시키는지, 그리고 태양 플레어(Sun Flare)가 컴퓨터 시스템에 미치는 영향에 대한 궁금증이 나타났다. 이러한 질문들은 우주 임무에서 시스템 안정성(System Reliability)을 확보하는 데 있어 중요한 고려 사항임을 시사한다.

How NASA built Artemis II’s fault-tolerant computer

댓글 0

첫 번째 댓글을 남겨보세요!