KAYUTS 정보 뉴스 KAYTUS, GPU 리소스 스케줄링 및 작업 ……

KAYTUS, GPU 리소스 스케줄링 및 작업 조율을 위한 매우 효율적인 AI 개발 플랫폼 MotusAI 출시

2024-05-14

MotusAI, 효율적인 통합 GPU 스케줄링을 구현하여 70%가 넘는 평균 클러스터 컴퓨팅 전력 활용률 달성

 

싱가포르 및 독일 함부르크 - 2024년 5월 14일 — 선도적인 IT 인프라 제공업체인 KAYTUS가 이제 전 세계적으로 체험 버전을 사용할 수 있는 AI 개발 플랫폼인 MotusAI를 공개했습니다. MotusAI는 딥 러닝 및 AI 개발에 적합하며, AI 개발 환경과 함께 GPU 및 데이터 리소스를 통합하여 컴퓨팅 리소스 할당, 작업 조정 및 중앙 집중식 관리가 간소화되었습니다. 학습 데이터는 가속화하고 AI 모델 개발 워크플로우를 원활하게 관리할 수 있습니다. 이 플랫폼은 리소스 투자를 대폭 줄이고, 개발 효율성을 높이며, 클러스터 컴퓨팅 전력 활용도를 70% 이상으로 높여 대규모 학습 작업 스케줄링 성능을 크게 향상시킵니다.

 

비용 대비 효과와 효율성을 위한 AI 개발 간소화

엔터프라이즈 AI 비즈니스 및 AI 모델 개발의 빠른 확장으로 인해 낮은 컴퓨팅 효율성, 모델 개발의 복잡성, 여러 시나리오에 걸친 작업 조정을 위한 다양한 요구 사항, 불안정한 컴퓨팅 리소스 등의 문제가 발생하고 있습니다. AI 비즈니스에서 효율적이고 유연한 안정적인 운영의 보장은 기업이 지속적으로 비즈니스 인사이트를 도출하고 수익을 창출하며 경쟁력을 유지하는 데 매우 중요한 요소입니다.

 

최대 컴퓨팅 성능을 위한 리소스 관리의 최적화

MotusAI는 지능적이고 유연한 GPU 스케줄링을 구현하여 리소스와 워크로드를 효율적으로 할당합니다. GPU 리소스가 수요에 따라 동적으로 할당되므로 컴퓨팅 성능에 대한 다양한 AI 워크로드 요구를 충족할 수 있습니다. MotusAI는 세분화된 GPU 스케줄링 및 멀티 인스턴스 GPU(MIG) 지원을 포함한 다차원의 동적 GPU 리소스 할당을 통해 모델 개발, 디버깅 및 학습과 같은 다양한 시나리오에서 컴퓨팅 성능 요구 사항에 효과적으로 대응할 수 있습니다.

 

다양한 시나리오의 다각적인 지원을 위한 작업 조정 간소화

MotusAI는 클라우드 네이티브 스케줄링 시스템을 완전히 바꿔 놓았습니다. 커뮤니티 버전을 능가하는 이 스케줄러는 대규모 POD 작업의 스케줄링 성능을 획기적으로 향상시켰습니다. MotusAI는 커뮤니티 스케줄러에 비해 5배가 넘는 처리량을 자랑하는 동시에 대기 시간은 5배를 절감시켜 수백 개의 POD에 대한 빠른 시작 및 환경 준비가 가능합니다. 따라서 대규모 학습을 위한 컴퓨팅 리소스의 효율적인 예약과 활용이 보장됩니다. 또한, MotusAI는 학습 및 추론 서비스 모두에 AI 워크로드를 동적으로 확장하여 버스트 작업을 지원하고 여러 시나리오에서 다양한 스케줄링 요구 사항을 충족할 수 있습니다.

 

MotusAI는 단일 카드 다중 인스턴스의 세분화된 분할부터 여러 시스템 및 카드에 걸친 대규모 병렬 컴퓨팅에 이르기까지 사용자의 컴퓨팅 리소스 극대화를 지원합니다. MotusAI는 컴퓨팅 파워 풀링, 동적 확장, GPU 단일 카드 재사용과 같은 기능을 통합하여 컴퓨팅 성능 활용도를 크게 향상시켜 70%가 넘는 평균 활용률을 달성합니다. 또한, 클러스터 토폴로지 인식 활용을 통해 네트워크 통신을 최적화하여 컴퓨팅 효율성도 향상되었습니다.

 

3배의 효율성 향상을 위한 데이터 전송 가속화

MotusAI는 로컬 로드 지원, 원격 데이터 컴퓨팅 지원 등의 혁신 기능을 통해 데이터 전송 가속화 부문에서 탁월한 성능을 자랑하며 계산 중 네트워크 I/O로 인한 지연을 제거합니다. MotusAI는 "제로 복사" 데이터 전송, 다중 스레드 검색, 증분 데이터 업데이트, 어피니티 스케줄링과 같은 전략을 활용하여 데이터 캐싱 주기를 크게 단축시킵니다. 이러한 개선점은 AI 개발 및 학습 효율성을 크게 향상시켜 데이터 학습 과정의 모델 효율성을 2~3배까지 높입니다.

 

자동 내결함 기능을 갖춘 안정적인 플랫폼

MotusAI는 컴퓨팅 리소스에 대한 성능 모니터링 및 경고를 지원하여 핵심 플랫폼 서비스에 대한 실시간 상태 업데이트를 제공합니다. 보안 수준이 더 높은 데이터에 대해서는 샌드박스 격리 메커니즘이 사용됩니다. 리소스 오류나 이상이 발생하는 경우, MotusAI는 자동 내결함 기능 프로세스를 시작하여 중단된 학습 작업 중에도 최대한 빠른 복구를 보장합니다. 이 방식으로 오류 처리 시간을 평균 90% 이상 절감할 수 있습니다.

 

AI 모델 개발을 종합적으로 관리하는 하나의 통합 솔루션

MotusAI는 AI 개발을 가속화하고 대규모 모델 개발의 모든 단계를 지원합니다. MotusAI는 데이터 샘플 및 소프트웨어 스택 관리부터 모델 아키텍처 설계, 코드 디버깅, 모델 학습, 매개변수 조정 및 평가 테스트 수행까지 완전한 플랫폼을 제공합니다. 이 플랫폼은 PyTorch 및 TensorFlow와 같이 널리 사용되는 개발 프레임워크와 Megatron 및 DeepSpeed와 같은 분산 교육 프레임워크를 통합합니다.

 

또한, MotusAI는 오프라인 및 온라인 테스트, A/B 테스트, 롤링 릴리스, 서비스 조정, 서비스 폐기를 포함하여 AI 추론 서비스의 포괄적인 수명주기 관리를 지원합니다. 이와 같은 기능은 AI 기술의 비즈니스 가치를 종합적으로 높여주므로 지속적인 비즈니스 성장을 기대할 수 있습니다.

 

또한, MotusAI는 컴퓨팅, 네트워킹, 스토리지 및 애플리케이션 리소스를 포괄하는 통합된 시각적 관리 및 운영 인터페이스를 제공합니다. 운영 담당자는 단일 인터페이스에서 전체 플랫폼 운영 상태를 종합적으로 관리, 모니터링, 평가할 수 있습니다.

 

무료 체험판 이용 가능

이제 MotusAI는 체험 기간 동안 전 세계적으로 테스트, 학습 및 지원 부문에서 한 달의 무료 원격 액세스를 제공합니다. 사용자는 KAYTUS의 로컬 배포 테스트 지원을 통해 자체 장치 및 환경을 사용하여 로컬 배포를 선택할 수도 있습니다. 자세한 정보1 및 등록2은 링크 1링크 2를 방문하세요.

 

KAYTUS 정보

KAYTUS는 최고의 IT 인프라 제품 및 솔루션 제공업체로 클라우드, AI, 엣지 컴퓨팅 및 기타 신규 기술을 위한 최첨단 개방형 친환경 인프라 솔루션 제품군을 제공합니다. 고객 중심 접근 방식을 바탕으로 KAYTUS는 애자일 비즈니스 모델을 통해 사용자 요구에 유연하게 대응합니다. KAYTUS.com에서 자세히 알아보기

 

미디어 담당자

media@kaytus.com


TOP

문의

KAYTUS는 쿠키를 사용하여 웹사이트 사용을 활성화하고 최적화하며, 콘텐츠를 개인화하고, 웹사이트 사용을 분석합니다. 자세한 정보는 당사의 개인정보 보호정책을참조하세요.