Aujourd’hui, nous sommes ravis d’annoncer l’aperçu d’une nouvelle fonctionnalité de filtrage intelligent d’Amazon SageMaker qui inspecte et évalue automatiquement les données de formation à la volée pour apprendre de manière sélective uniquement à partir des échantillons de données les plus informatifs, réduisant ainsi le temps et les coûts de formation des modèles. à 35%. Vous pouvez vous lancer dans le tri intelligent des données en quelques minutes sans apporter de modifications à vos pipelines de données ou scripts de formation existants.
Le filtrage intelligent utilise votre modèle vivant pendant la formation pour analyser les échantillons de données entrants. Il supprime ensuite automatiquement les échantillons présentant une faible perte, ce qui n’améliorera pas le processus d’apprentissage du modèle. En utilisant de manière sélective uniquement les échantillons de données les plus informatifs, le filtrage intelligent réduit le temps et les coûts de formation des modèles d’apprentissage profond. Les clients qui entraînent des modèles d’apprentissage profond avec PyTorch sur des instances GPU accélérées dans SageMaker peuvent réduire le temps de formation jusqu’à 35 %. Étant donné que les échantillons exclus entraînent une perte relativement faible, l’impact sur la précision de votre modèle entraîné est minime, voire inexistant. Pour démarrer avec le tamisage intelligent, consultez notre documentation associée.
Vous pouvez lire l’article original (en Angais) sur le siteaws.amazon.com