Accueil À propos de nous Actualités KAYTUS lance MotusAI, une ……

KAYTUS lance MotusAI, une plateforme de développement de l'IA pour l'ordonnancement des ressources GPU et l'orchestration des tâches à haute efficacité

2024-05-14

MotusAI atteint un taux moyen d'utilisation de la puissance de calcul des clusters de plus de 70 % en mettant en œuvre un ordonnancement efficace et unifié des GPU

 

Singapour et Hambourg, Allemagne— 14 mai 2024 — KAYTUS, un fournisseur d'infrastructure informatique de premier plan, a dévoilé MotusAI, une plateforme de développement de l'IA désormais accessible à l'essai dans le monde entier. MotusAI est conçu pour l'apprentissage profond et le développement de l'IA, intégrant les ressources GPU et de données aux environnements de développement de l'IA afin de rationaliser l'allocation des ressources informatiques, l'orchestration des tâches et la gestion centralisée. Il accélère les données d'entraînement et gère les flux de travail de développement de modèles d'IA de manière transparente. Cette plateforme réduit considérablement les investissements en ressources, renforce l'efficacité du développement, augmente l'utilisation de la puissance de calcul des clusters à plus de 70 % et améliore considérablement la performance de la planification des tâches de formation à grande échelle.

 

Rationaliser le développement de l'IA pour plus de rentabilité et d'efficacité

L'expansion rapide des activités d'IA des entreprises et le développement de modèles d'IA posent des défis, notamment une faible efficacité informatique, la complexité du développement des modèles, des exigences variées en matière d'orchestration des tâches dans différents scénarios et l'instabilité des ressources informatiques. Il est essentiel pour les entreprises d'assurer un fonctionnement efficace, flexible et stable de l'activité d'IA afin d'obtenir des informations commerciales, de générer des revenus et de maintenir leur compétitivité.

 

Optimiser la gestion des ressources pour une puissance de calcul maximale

MotusAI alloue efficacement les ressources et les charges de travail en mettant en œuvre une planification intelligente et flexible des GPU. Il répond aux diverses demandes de puissance de calcul des charges de travail d'IA en allouant dynamiquement les ressources GPU en fonction de la demande. Grâce à l'allocation multidimensionnelle et dynamique des ressources GPU, y compris la planification fine des GPU et la prise en charge des GPU multi-instances (MIG), MotusAI répond efficacement aux exigences en matière de puissance de calcul dans divers scénarios tels que le développement de modèles, le débogage et la formation.

 

Rationalisation de l'orchestration des tâches pour une prise en charge polyvalente de divers scénarios

MotusAI a révolutionné les systèmes d'ordonnancement cloud natifs. Son ordonnanceur surpasse la version communautaire en améliorant considérablement les performances d'ordonnancement des tâches POD à grande échelle. MotusAI permet un démarrage rapide et une préparation de l'environnement pour des centaines de POD, avec un débit cinq fois supérieur et une latence cinq fois inférieure à celle de l'ordonnanceur communautaire. Cela garantit une programmation et une utilisation efficaces des ressources informatiques pour le training de modèles à grande échelle. En outre, MotusAI permet une mise à l'échelle dynamique des charges de travail d'IA pour les services de training et d'inférence, en prenant en charge les tâches en rafale et en répondant à divers besoins de planification dans différents scénarios.

 

MotusAI permet aux utilisateurs de maximiser les ressources informatiques, depuis la division fine d'instances multiples sur une seule carte jusqu'au calcul parallèle à grande échelle sur plusieurs machines et cartes. En intégrant des fonctionnalités telles que la mise en commun de la puissance de calcul, la mise à l'échelle dynamique et la réutilisation d'une seule carte GPU, MotusAI améliore considérablement l'utilisation de la puissance de calcul, atteignant un taux d'utilisation moyen de plus de 70 %. En outre, il améliore l'efficacité des calculs en tirant parti de la connaissance de la topologie des clusters et en optimisant la communication avec le réseau.

 

Accélération du transfert de données pour une efficacité trois fois supérieure

MotusAI excelle dans l'accélération du transfert de données grâce à des caractéristiques innovantes telles que le chargement local et le calcul de données à distance, ce qui élimine les retards causés par les E/S du réseau pendant le calcul. Grâce à des stratégies telles que le transfert de données « sans copie », l'extraction multithread, la mise à jour incrémentale des données et la planification des affinités, MotusAI réduit considérablement les cycles de mise en cache des données. Ces améliorations permettent d'accroître considérablement l'efficacité du développement et du training de l'IA, ce qui multiplie par deux ou trois l'efficacité des modèles lors du training data.

 

Plateforme fiable et automatiquement tolérante aux pannes

MotusAI prend en charge la surveillance des performances et les alertes pour les ressources informatiques, en fournissant des mises à jour en temps réel de l'état des services de la plateforme principale. Il utilise des mécanismes d'isolation de type « bac à sable » pour les données présentant des niveaux de sécurité plus élevés. En cas de défaillance ou d'anomalie des ressources, MotusAI lance automatiquement des processus de tolérance aux pannes afin d'assurer la reprise la plus rapide possible pendant les tâches de formation interrompues. Cette approche permet de réduire le temps de traitement des défaillances de plus de 90 % en moyenne.

 

Gestion complète du développement de modèles d'IA dans une solution intégrée

MotusAI accélère le développement de l'IA et supporte chaque étape du développement d'un grand modèle. De la gestion des échantillons de données et des piles logicielles à la conception d'architectures de modèles, en passant par le débogage du code, l'entraînement des modèles, l'ajustement des paramètres et les tests d'évaluation, MotusAI offre une plateforme complète. Elle intègre des cadres de développement populaires comme PyTorch et TensorFlow, ainsi que des cadres d'entraînement distribués comme Megatron et DeepSpeed.

 

De plus, MotusAI permet une gestion complète du cycle de vie des services d'inférence IA, y compris les tests hors ligne et en ligne, les tests A/B, les mises à jour, l'orchestration des services et le déclassement des services. Ces caractéristiques améliorent collectivement la valeur commerciale de la technologie de l'IA, favorisant ainsi la croissance continue de l'entreprise.

 

En outre, MotusAI fournit une interface visuelle intégrée de gestion et d'exploitation qui couvre les ressources informatiques, de réseau, de stockage et d'application. Le personnel opérationnel peut gérer, surveiller et évaluer le statut global du fonctionnement de la plateforme à travers une interface unique.

 

Essai gratuit disponible

MotusAI est désormais disponible dans le monde entier pour une période d'essai, offrant un accès à distance gratuit pendant un mois, ainsi que des tests, une formation et une assistance. Les utilisateurs peuvent également opter pour un déploiement local en utilisant leurs propres appareils et leur propre environnement, avec l'aide de KAYTUS pour les tests de déploiement local. Pour plus d'informations1 et pour s'inscrire2, veuillez consulter le site Lien1Lien2.

 

À propos de KAYTUS

KAYTUS est un fournisseur leader de produits et de solutions d'infrastructure informatique, offrant une suite de solutions d'infrastructure de pointe, ouvertes et respectueuses de l'environnement pour le cloud, l'IA, l'edge computing et d'autres technologies émergentes. En adoptant une approche centrée sur le client, KAYTUS s'adapte avec souplesse aux besoins des utilisateurs grâce à son modèle économique agile. Pour en savoir plus, consultez le site KAYTUS.com

 

Contacts avec les médias

media@kaytus.com


TOP

Nous contacter

KAYTUS utilise des cookies pour permettre et optimiser l'utilisation du site web, personnaliser le contenu et analyser l'utilisation du site web. Veuillez consulter notre politique de confidentialité pour plus d'informations.