- Fonctionnalités
- Pricing

Si un agent ne fonctionne que sur un notebook spécialement configuré, il n’est pas prêt pour la production. Les vrais clients attendent une fiabilité sur des dizaines d’applications, une conformité stricte et des coûts prévisibles. C’est la réalité quotidienne des cadres intermédiaires en informatique.
Des recherches récentes montrent l'écart entre les résultats des benchmarks et les tâches réelles. Sur GAIA, les humains ont obtenu un score de 92 %, tandis qu'un modèle de pointe équipé d'outils n'a atteint qu'environ 15 %.¹² AgentBench constate des lacunes similaires chez les agents dans des environnements interactifs qui ressemblent davantage au monde chaotique et dynamique dans lequel évoluent tes systèmes.³⁴
Pour les responsables chargés de la disponibilité et des risques, « ça marche sur mon ordinateur portable » n’est pas un plan de test. Tu dois laisser les agents manipuler tes propres données, outils et cas limites, sans toucher à la production.
Upsun fournit à chaque branche Git un environnement en direct de niveau production qui inclut des services clonés tels que des bases de données et des caches. Cela signifie que tu peux créer un clone de production réaliste en quelques minutes. Découvre comment les environnements sont mappés aux branches et comment les environnements de test héritent des données pour des tests réalistes.
Tu as besoin de protéger les champs sensibles tout en conservant la structure et la distribution des données ? Utilise des modèles de masquage personnalisés pour que les bases de données de prévisualisation soient utiles et exemptes d’informations personnelles identifiables. Lis le guide de masquage et les exemples.⁵
Upsun est conçu à la fois pour les humains et les agents IA. Il expose une configuration structurée et des API prévisibles, et tes assistants se connectent via des serveurs MCP pour obtenir un contexte riche et en temps réel sur ta stack. Déploie des serveurs MCP sur Upsun et connecte PostgreSQL MCP à un clone en toute sécurité.
Un plan d'évaluation crédible des agents IA teste tes pipelines RAG, tes appels d'outils, tes délais d'attente, tes tentatives de relance, tes autorisations et tes chemins d'échec sur les mêmes schémas et services que ceux que tu utilises en production. L'approche « une branche par environnement » d'Upsun standardise le processus et réduit les « inconnues inconnues » qui n'apparaissent qu'avec des charges de travail réelles.
Démarrage rapide :
# Create an isolated prod clone for agent testing
upsun branch agent-evals
# Tail logs while agents run their scenarios
upsun log -e agent-evals appConsulte la référence CLI.
Ne te contente pas d'examiner les résultats à l'œil nu. Comme pour les tests d'applications classiques, effectue une évaluation RAG appropriée sur le contenu de ton organisation. Un cadre pratique évalue trois éléments : la pertinence du contexte, l'ancrage dans la réalité et la pertinence de la réponse.⁶
De nombreuses boîtes à outils permettent de gérer les évaluations d’IA, mais si tu débutes, Langchain est le meilleur choix pour commencer à créer et à exécuter tes tests LLM.
Dans Upsun, tu peux exécuter ces évaluations dans le cadre de ton processus de branche et maintenir l'observabilité grâce aux journaux et au profilage continu. Consulte l'accès aux journaux et le profilage.
Les agents s’améliorent lorsqu’ils peuvent réellement récupérer, transformer et écrire via les interfaces que tes équipes utilisent aujourd’hui. Avec Upsun, les modèles MCP et agent-à-agent peuvent s’exécuter dans l’environnement cloné sur tes API et modèles de données réels, ce qui te permet de détecter les lacunes en matière d’autorisations, la limitation de débit ou la dérive de schéma bien avant la mise en production. Découvre les articles pour les développeurs.

