“테슬라는 전 세계에서 5번째로 강력한 슈퍼컴퓨터를 쓰고 있습니다.”

테슬라 AI 개발총괄인 안드레아 카르파티는 6월19일부터 25일까지 온라인으로 열린 세계 최대 컴퓨터 비전 콘퍼런스 ‘CVPR 2021’에서 이같이 말하며 “테슬라는 자율주행 데이터를 학습시키는 자체 슈퍼컴퓨터를 보유하고 있는데 전 세계 슈퍼컴퓨터 가운데 다섯 번째 성능”이라고 말했다.

| 안드레아 카르파티 테슬라 AI 개발총괄

테슬라 전기차 ‘모델’ 시리즈에는 자율주행 기능의 오토파일럿 모드가 있는데 슈퍼컴퓨터는 오토파일럿이 본래 역할을 다할 수 있도록 어마어마한 양의 데이터를 학습한다. 더 많은 양질의 데이터를 학습할수록 오토파일럿 또한 점점 더 영리해진다는 의미다. 초당 36프레임으로 녹화된 약 10초 길이의 1백만 개의 클립이 수집되고 총 1.5페타바이트(PB)에 이르는 엄청난 양의 데이터가 쌓이면, 심층 신경망(DNN)이 오류 없이 작동할 때까지 슈퍼컴퓨터는 시나리오를 반복해서 학습한다. 학습 데이터는 차량으로 전송되고 프로세스가 다시 시작되는 과정을 거친다. 학습할 데이터량은 실시간으로 급증하고, 반영해야 할 예외 상황도 계속 새로 생겨나기에 어마어마한 컴퓨팅 파워가 필요하다.

| 엔비디아 A100 GPU

카르파티는 세계에서 5번째로 강력한 테슬라의 슈퍼컴퓨터는 ‘도조(Dojo·どうじょう)’의 바로 전 단계라일 뿐이라고 강조했다. 다음 단계의 슈퍼컴퓨터가 도조라는 의미다. 세계에서 5번째로 강력한 슈퍼컴퓨터보다 빠른 도조는 도대체 어떤 성능을 갖는 것일까. 확실한 것은 전 세계 5위 슈퍼컴퓨터보다 연산 속도가 빠르다는 거다.

카르파티는 세계 5위의 슈퍼컴퓨터 실력을 공개했는데 “DNN을 훈련하고 이렇게 많은 양의 데이터를 저장하기 위해서는 엄청난 양의 컴퓨팅이 필요하다.”라며 “8개의 엔비디아 A100 텐서 코어 GPU(총 5760 GPU)의 720개 노드를 활용하여 업계 최고 수준인 1.8엑사플롭 성능을 구현했다.”라고 설명했다. 이어 “지난 몇 년 동안 도조 완성을 위해 노력해왔으며, 올해 말 완성될 수 있을 것”이라고 덧붙였다.

2019년 4월 자율주행 이벤트 데이에서 일론 머스크 테슬라 CEO가 처음 언급한 도조는 일본어로 심신을 수련하는 장소를 뜻한다. 테슬라의 완전 자율주행 인공지능(AI)을 학습시키기 위한 슈퍼컴퓨터가 구현하는 가상의 공간인 셈이다. 가상 공간에서 수만 대의 차량을 창조하고 현실과 비슷한 조건 또는 비현실적인 혹독한 조건에서 테스트를 할 수 있으며 수천만 킬로미터의 주행을 쉬지 않고 달리고 사고로 인한 인명, 재산 피해도 발생하지 않는다는 장점이 있다.

일론 머스크는 테슬라가 지난 몇 년 간 도조를 개발하고 있으며, 올해 말까지 도조가 준비되어야 한다고 밝힌 바 있다.

오토파일럿 다음 스텝의 핵심
이상우
기술을 사랑합니다.