Vertex AI Agent Engine (anciennement appelé LangChain sur Vertex AI ou Vertex AI Reasoning Engine) est une Google Cloud plate-forme qui permet aux développeurs de déployer, de gérer et d'évoluer des agents d'IA en production. Agent Engine gère l'infrastructure pour faire évoluer les agents en production, ce qui vous permet de vous concentrer sur la création d'applications. Vertex AI Agent Engine propose les fonctionnalités suivantes:
Environnement d'exécution géré:
- Déployez et faites évoluer des agents avec un environnement d'exécution géré et des fonctionnalités de gestion de bout en bout.
- Utilisez des fonctionnalités de sécurité, y compris la conformité avec VPC-SC et la configuration de l'authentification et d'IAM.
- Accédez aux modèles et aux outils tels que l'appel de fonction.
- Déployez des agents créés à l'aide de différents frameworks Python:
Qualité et évaluation:
- Assurez-vous de la qualité des agents avec le service d'évaluation de l'IA générative intégré.
- Améliorez les performances de vos agents avec Example Store.
- Optimisez les agents avec des entraînements de modèles Gemini.
Gérer le contexte:
Sessions: les sessions du moteur d'agents vous permettent de stocker les interactions individuelles entre les utilisateurs et les agents, ce qui fournit des sources définitives pour le contexte de la conversation.
Example Store: Example Store vous permet de stocker et de récupérer dynamiquement des exemples few-shot.
Surveillance:
- Comprendre le comportement des agents avec Google Cloud Trace (compatible avec OpenTelemetry), Cloud Monitoring et Cloud Logging
Vertex AI Agent Engine fait partie de Vertex AI Agent Builder, une suite de fonctionnalités permettant de découvrir, de créer et de déployer des agents d'IA.
Créer et déployer sur Vertex AI Agent Engine
Remarque:Pour une expérience de développement et de déploiement simplifiée, basée sur un IDE avec Vertex AI Agent Engine, envisagez le agent-starter-pack. Il fournit des modèles prêts à l'emploi, une UI intégrée pour l'expérimentation, et simplifie le déploiement, les opérations, l'évaluation, la personnalisation et l'observabilité.
Le workflow de création d'un agent sur Vertex AI Agent Engine est le suivant:
Étapes | Description |
---|---|
1. Configurer l'environnement | Configurez votre projet Google et installez la dernière version du SDK Vertex AI pour Python. |
2. Développer un agent | Développez un agent pouvant être déployé sur Vertex AI Agent Engine. |
3. Déployer l'agent | Déployez l'agent dans l'environnement d'exécution géré Vertex AI Agent Engine. |
4. Utiliser l'agent | Interrogez l'agent en envoyant une requête API. |
5. Gérer l'agent déployé | Gérez et supprimez les agents que vous avez déployés sur Vertex AI Agent Engine. |
Les étapes sont illustrées dans le schéma suivant :
Frameworks compatibles
Le tableau suivant décrit le niveau de compatibilité du moteur d'agent Vertex AI avec différents frameworks d'agent:
Niveau d'assistance | Frameworks d'agent |
---|---|
Modèle personnalisé: vous pouvez adapter un modèle personnalisé pour permettre le déploiement dans Vertex AI Agent Engine à partir de votre framework. | CrewAI, frameworks personnalisés |
Intégration du SDK Vertex AI: Vertex AI Agent Engine fournit des modèles gérés par framework dans le SDK et la documentation Vertex AI. | AG2, LlamaIndex |
Intégration complète: les fonctionnalités sont intégrées pour fonctionner dans le framework, le moteur d'agent Vertex AI et l'écosystème plus large. Google Cloud | Kit de développement d'agent (ADK), LangChain, LangGraph |
Déployer en production avec le pack de démarrage pour les agents
Le pack de démarrage pour les agents est un ensemble de modèles d'agents d'IA générative prêts pour la production créés pour Vertex AI Agent Engine. Le pack de démarrage pour les agents comprend les éléments suivants:
- Modèles d'agent prédéfinis:ReAct, RAG, multi-agent et autres modèles.
- Playground interactif: testez et interagissez avec votre agent.
- Infrastructure automatisée: utilise Terraform pour simplifier la gestion des ressources.
- Pipelines CI/CD: workflows de déploiement automatisés utilisant Cloud Build.
- Observabilité: compatibilité intégrée avec Cloud Trace et Cloud Logging.
Pour commencer, consultez le guide de démarrage rapide.
Cas d'utilisation
Pour en savoir plus sur Vertex AI Agent Engine avec des exemples de bout en bout, consultez les ressources suivantes:
Cas d'utilisation | Description | Liens |
---|---|---|
Créer des agents en se connectant à des API publiques | Convertir des devises Créez une fonction qui se connecte à une application de change de devises pour permettre au modèle de fournir des réponses précises à des requêtes telles que "Quel est le taux de change de l'euro par rapport au dollar aujourd'hui ?" |
Notebook du SDK Vertex AI pour Python : présentation de la création et du déploiement d'un agent avec Vertex AI Agent Engine |
Concevoir un projet d'énergie solaire communautaire. Identifiez les emplacements potentiels, recherchez les autorités administratives et les fournisseurs concernés, et examinez les images satellites et le potentiel solaire des régions et des bâtiments pour trouver l'emplacement optimal pour installer vos panneaux solaires. |
Notebook du SDK Vertex AI pour Python : créer et déployer un agent de l'API Google Maps avec Vertex AI Agent Engine | |
Créer des agents en se connectant à des bases de données | Intégration à AlloyDB et Cloud SQL pour PostgreSQL. | Article de blog : Annonce de LangChain sur Vertex AI pour AlloyDB et Cloud SQL pour PostgreSQL Notebook du SDK Vertex AI pour Python : déployer une application RAG avec Cloud SQL pour PostgreSQL dans Vertex AI Agent Engine Notebook du SDK Vertex AI pour Python : déployer une application RAG avec AlloyDB pour PostgreSQL dans Vertex AI Agent Engine |
Créez des agents avec des outils qui accèdent aux données de votre base de données. | Notebook du SDK Vertex AI pour Python : déployer un agent avec Vertex AI Agent Engine et la boîte à outils MCP pour les bases de données | |
Interroger et comprendre des datastores structurés en langage naturel | Notebook SDK Vertex AI pour Python : créer un agent de recherche conversationnel avec Vertex AI Agent Engine et le RAG dans Vertex AI Search | |
Interroger et comprendre des bases de données orientées graphe en langage naturel | Article de blog : GraphRAG GenAI et agents d'IA utilisant Vertex AI Agent Engine avec LangChain et Neo4j | |
Interroger et comprendre des magasins de vecteurs en langage naturel | Article de blog : Simplifier le RAG GenAI avec MongoDB Atlas et Vertex AI Agent Engine | |
Créer des agents avec le kit de développement d'agents (preview) | Créez et déployez des agents à l'aide de l'Agent Development Kit. | Agent Development Kit -- Deploy to Vertex AI Agent Engine |
Créer des agents avec des frameworks OSS | Créez et déployez des agents à l'aide du framework Open Source Onetwo. | Article de blog : OneTwo et Vertex AI Agent Engine : explorer le développement d'agents d'IA avancée sur Google Cloud |
Créer et déployer des agents à l'aide du framework Open Source LangGraph. | Notebook du SDK Vertex AI pour Python : créer et déployer une application LangGraph avec Vertex AI Agent Engine | |
Déboguer et optimiser les agents | Créer et tracer des agents à l'aide d'OpenTelemetry et de Cloud Trace | Notebook SDK Vertex AI pour Python : débogage et optimisation des agents : guide de traçage dans Vertex AI Agent Engine |
Sécurité d'entreprise
Le moteur d'agent Vertex AI est compatible avec VPC Service Controls pour renforcer la sécurité des données et limiter les risques d'exfiltration. Lorsque VPC Service Controls est configuré, l'agent déployé conserve un accès sécurisé aux API et services Google, tels que l'API BigQuery, l'API Cloud SQL Admin et l'API Vertex AI, ce qui garantit un fonctionnement fluide dans le périmètre que vous avez défini. Plus important encore, VPC Service Controls bloque efficacement tout accès à l'Internet public, limitant le transfert de données aux limites de votre réseau autorisé et améliorant considérablement votre posture de sécurité d'entreprise.
Régions où le service est disponible
Vertex AI Agent Engine est compatible avec les régions suivantes:
Région | Emplacement | Description | Étape de lancement |
---|---|---|---|
us-central1 |
Iowa | Les versions v1 et v1beta1 sont compatibles. |
DG |
us-west1 |
Oregon | Les versions v1 et v1beta1 sont compatibles. |
DG |
europe-west1 |
Belgique | Les versions v1 et v1beta1 sont compatibles. |
DG |
europe-southwest1 |
Madrid | Les versions v1 et v1beta1 sont compatibles. |
DG |
asia-east1 |
Taïwan | Les versions v1 et v1beta1 sont compatibles. |
DG |
asia-northeast1 |
Tokyo | Les versions v1 et v1beta1 sont compatibles. |
DG |
Les régions suivantes sont compatibles avec les sessions du moteur d'agent:
Région | Emplacement | Description | Étape de lancement |
---|---|---|---|
us-central1 |
Iowa | La version v1beta1 est compatible. |
Aperçu |
Quota
Les quotas et limites suivants s'appliquent à Vertex AI Agent Engine pour un projet donné dans chaque région.Quota | Valeur |
---|---|
Nombre d'opérations Créer, Mettre à jour, Supprimer de Vertex AI Agent Engine par minute | 10 |
Nombre de requêtes/StreamQuery Vertex AI Agent Engine par minute | 60 |
Nombre maximal de ressources Vertex AI Agent Engine | 100 |
Tarifs
Les tarifs sont basés sur les ressources de calcul (heures de vCPU) et de mémoire (heures de Go) utilisées par les agents déployés dans l'environnement d'exécution géré par le moteur d'agent Vertex AI.
Produit | ID du SKU | Prix |
---|---|---|
vCPU ReasoningEngine | 8A55-0B95-B7DC | 0,0994 $/vCPU-H |
Mémoire ReasoningEngine | 0B45-6103-6EC1 | 0,0105 $/Gio/h |
Pour en savoir plus, reportez-vous à la page Tarifs.