‘EXAONE’의 성능 개선과 비용 효율성을 동시에 실현한 AI 인프라 구축 사례를 확인해 보세요.
LG AI연구원 고객 스토리를 영상으로 확인해보세요:
LG AI연구원은 AI 기반의 기술 혁신과 생태계 확장을 주도하는 글로벌 AI 연구기관으로서, 인류의 더 나은 삶을 위한 차세대 AI 기술 연구에 앞장서고 있습니다. 2021년 12월 AI 파운데이션 모델인 EXAONE 1.0을 선보인 이후, 2024년 12월에는 성능을 개선한 EXAONE 3.5 버전, 2025년 3월에는 추론 특화 모델인 EXAONE Deep까지 연이어 선보이며, 두 모델 모두를 오픈소스로 공개해 전 세계 개발자 및 연구자들과 기술을 공유하고 글로벌 AI 생태계 확장에 기여하고 있습니다. Pain Point 비용 효율과 학습 성능을 동시에 확보할 인프라 환경 필요LG AI연구원은 초거대 AI 모델의 학습을 Public Cloud 환경에서 운영해 왔습니다. 초기에는 투자 부담이 적고, 자원을 유연하게 확보할 수 있다는 점에서 연구 개발의 민첩성과 유연성을 확보하는 데 효과적이었지만, EXAONE의 모델 규모와 학습 수요가 급격히 증가하면서 클라우드 자원 사용량과 비용이 빠르게 늘어났고, 그에 대한 통제도 점점 어려워졌습니다.또한 연구원 조직이 확장되고 연구 범위가 고도화되면서, 최신 GPU 및 고성능 서버에 대한 수요가 빠르게 증가했고, 이에 따라 Platform & Infra Team 은 자원 요청 대응과 할당, 기술 지원 업무로 인해 운영 부담이 가중되고 있었습니다.Solution① 다양한 인프라 환경을 통합한 Hybrid Cloud 구성LG CNS는 LG AI연구원의 AI 학습 및 개발 환경 전반에 대한 인터뷰와 자원 실사를 통해 요구 사항을 면밀히 분석했습니다. 그 결과, 고정형 자원이 필요한 AI 학습 환경은 On-Premise로, 민첩성과 유연성이 중요한 개발·테스트 환경은 Public Cloud로 분리해 운영하는 방식이 효과적이라는 방향을 도출하였고, 이를 기반으로 Hybrid Cloud 기반의 인프라 환경을 구축하였습니다.② AI 인프라 아키텍처 최적화LG CNS는 LG AI연구원의 고도화된 AI 학습을 안정적으로 지원하기 위해, AI 워크로드 특성에 맞춘 인프라 아키텍처 최적화 작업을 수행했습니다.AI 모델 학습 과정은 수많은 데이터를 동시에 처리해야 하기 때문에, 이를 빠르게 수행하려면 여러 대의 GPU가 동시에 협력하는 병렬·분산 구조가 필요합니다. 이에 따라 GPU 클러스터 기반의 구조를 설계하고, 대규모 데이터를 빠르게 처리하며 학습 시간을 획기적으로 단축할 수 있도록 인프라를 구성했습니다.성능 최적화 측면에서도 데이터 처리 속도에 영향을 주는 병목 지점을 없애기 위해 스토리지, 네트워크, 서버, 스케줄러 등 병렬 연산에 필요한 요소들을 유기적으로 연결하고, 데이터 입출력을 신속하게 처리할 수 있도록 분산 스토리지를 가속화했습니다. 자원 사용 현황을 실시간으로 확인하고 운영 상태를 한눈에 파악할 수 있는 모니터링 환경도 함께 구축했습니다.아울러, 빠르게 변화하는 GPU 기술 트렌드에 유연하게 대응할 수 있도록 On-Premise GPU 자원을 임대 방식으로 제공하는 구조를 도입해, 확장성과 유연성까지 고려한 인프라 체계를 완성했습니다.Change AI 모델 연구와 서비스 개발 등 핵심 업무에 집중할 기반 확보LG AI연구원은 Hybrid Cloud 기반의 분산 학습 인프라를 구축함으로써, 기존 대비 TCO(Total Cost of Ownership)를 약 30% 절감하는 효과를 거두었습니다.고성능 GPU 서버와 최적화된 인프라 설계를 통해 데이터 처리 병목 구간을 해소하고, 최신 GPU 기술을 효율적으로 활용함으로써 학습 속도와 인프라 전체 성능을 크게 개선할 수 있었습니다. 또한 장애 발생 시 신속한 대응이 가능해지면서, 보다 안정적인 연구 환경을 확보하게 되었습니다.더불어, 인프라 구축 이후에도 조직과 연구 업무의 확장에 따라 GPU 자원을 연구 부서 간 유동적으로 재배치할 수 있도록 환경을 개선하였고, LG CNS가 운영 업무를 전문적으로 지원함으로써 Platform & Infra Team의 반복적인 자원 관리 및 기술 지원 업무 부담을 실질적으로 줄일 수 있었습니다. 이를 통해 LG AI연구원은 AI 모델 연구와 서비스 개발 등 본연의 핵심 업무에 더욱 집중할 수 있는 기반을 확보하게 되었습니다.
※ 기업명 검색 시, 근무기업의 사업자등록증에 기재된 한글 기업명이 가장 정확하게 검색됩니다. (예시: LG CNS -> 엘지씨엔에스)