Crea un data lakehouse abierto, gestionado e inteligente en Google Cloud
Unifica y gestiona tus datos multimodales con un data lakehouse de alto rendimiento integrado con la IA líder del sector de Google. Saca el máximo partido de Apache Iceberg y de la primera solución de autoescalado sin servidor de Spark del sector para simplificar las iniciativas de procesamiento de datos, analíticas e IA.
Las nuevas innovaciones en formatos de datos abiertos, la gobernanza inteligente de datos para IA, el procesamiento de datos acelerado y las herramientas de desarrollo avanzadas con asistencia de IA se combinan para optimizar la gestión de datos y acelerar la innovación.
BigLake
Disfruta de la apertura de Apache Iceberg con una gestión de almacenamiento de nivel empresarial
BigLake proporciona un motor de almacenamiento Iceberg nativo para la interoperabilidad de Cloud Storage, ofrece una gestión de metadatos de tiempo de ejecución unificada, permite analíticas avanzadas y la ciencia de datos, y proporciona una gestión de datos automatizada con gobernanza integrada. Cualquier motor compatible con Iceberg puede usar la gestión automatizada de tablas de BigLake para mejorar el rendimiento de las consultas y reducir los costes.
“La colaboración con Google Cloud ha sido fundamental en nuestro viaje para crear el lakehouse abierto de nueva generación de Snap y democratizar Spark e Iceberg en nuestra comunidad de desarrolladores.”
Zhengyi Liu, directora sénior de ingeniería de software de Snap
Google Cloud Serverless para Apache Spark
Spark sin servidor ofrece un alto rendimiento y un procesamiento ultrarrápido sin necesidad de gestionar clústeres
Transforma tu lakehouse con Google Cloud sin servidores para Apache Spark. Disfruta de un inicio rápido y de cero sobrecargas operativas, y mejora el rendimiento de tus cargas de trabajo de Spark con el nuevo motor Lightning. Esta potente combinación con Gemini aumenta la productividad y ofrece hasta un 60 % menos de coste total de propiedad (CTP).
“Consideramos que SQL y Spark son dos formas complementarias de acceder a los datos y transformarlos. Spark nos resulta especialmente útil en casos prácticos que requieren una lógica empresarial compleja, que, aunque sea de nicho, es extremadamente importante para el negocio. Contar con una plataforma unificada para SQL, Spark y la IA, con la experiencia de desarrollo en cuadernos, simplificará considerablemente estos casos prácticos tan importantes.”
Andrés Sopeña Pérez, director de ingeniería de contenido de Trivago
Dataplex Universal Catalog
Simplifica la exploración, la comprensión y la confianza de los datos de tu data lakehouse
Dataplex Universal Catalog es la solución de gobernanza unificada de datos para IA de Google Cloud. El catálogo basado en IA centraliza los metadatos empresariales, técnicos y operativos en Google Cloud y proporciona información valiosa basada en IA. Es compatible con formatos abiertos, como Apache Iceberg, para que puedas integrar la gobernanza en todo tu lakehouse.
“Dataplex ha sido fundamental para transformar nuestra plataforma de datos en un ecosistema de datos seguro, eficiente y escalable. Nos centramos en la gobernanza de datos, el descubrimiento, la observabilidad y el cumplimiento de las normativas de seguridad, por lo que estamos preparados para afrontar los retos de la gestión de datos en la era digital. Dataplex permite a nuestros equipos aprovechar todo el potencial de los datos y fomentar el crecimiento e innovación continuos de Box.Inc.”
Asmita Kulkarni, responsable sénior de producto de Box.Inc
BigQuery Studio y extensiones de IDE
Mejorar Apache Spark para cargas de trabajo avanzadas de ciencia de datos y de IA y aprendizaje automático en arquitecturas de lakehouse optimizando el desarrollo y las operaciones
Dataproc mejora Spark para IA y aprendizaje automático en lakehouses con nuevas innovaciones para entornos de ejecución de aprendizaje automático con controladores de GPU y bibliotecas de aprendizaje automático habituales. Los cuadernos de Colab Enterprise en BigQuery Studio y los entornos de desarrollo integrados (IDE) de terceros proporcionan MLOps integradas con Vertex AI y flujos de procesamiento de producción optimizados para agilizar la ciencia de datos.
“Shopify ha invertido en la contratación de un equipo con un conjunto diverso de habilidades para mantenerse a la vanguardia de las tendencias en ciencia e ingeniería de datos. En las primeras pruebas con BigQuery Studio, nos gustó la capacidad de Google para conectar diferentes herramientas para diferentes usuarios en una experiencia simplificada. Vemos esta situación como una oportunidad para reducir las fricciones en nuestro equipo sin renunciar a la escalabilidad que esperamos de BigQuery.”
Zac Roberts, director de ingeniería de datos de Shopify
BigLake
Disfruta de la apertura de Apache Iceberg con una gestión de almacenamiento de nivel empresarial
BigLake proporciona un motor de almacenamiento Iceberg nativo para la interoperabilidad de Cloud Storage, ofrece una gestión de metadatos de tiempo de ejecución unificada, permite analíticas avanzadas y la ciencia de datos, y proporciona una gestión de datos automatizada con gobernanza integrada. Cualquier motor compatible con Iceberg puede usar la gestión automatizada de tablas de BigLake para mejorar el rendimiento de las consultas y reducir los costes.
“La colaboración con Google Cloud ha sido fundamental en nuestro viaje para crear el lakehouse abierto de nueva generación de Snap y democratizar Spark e Iceberg en nuestra comunidad de desarrolladores.”
Zhengyi Liu, directora sénior de ingeniería de software de Snap
Google Cloud Serverless para Apache Spark
Spark sin servidor ofrece un alto rendimiento y un procesamiento ultrarrápido sin necesidad de gestionar clústeres
Transforma tu lakehouse con Google Cloud sin servidores para Apache Spark. Disfruta de un inicio rápido y de cero sobrecargas operativas, y mejora el rendimiento de tus cargas de trabajo de Spark con el nuevo motor Lightning. Esta potente combinación con Gemini aumenta la productividad y ofrece hasta un 60 % menos de coste total de propiedad (CTP).
“Consideramos que SQL y Spark son dos formas complementarias de acceder a los datos y transformarlos. Spark nos resulta especialmente útil en casos prácticos que requieren una lógica empresarial compleja, que, aunque sea de nicho, es extremadamente importante para el negocio. Contar con una plataforma unificada para SQL, Spark y la IA, con la experiencia de desarrollo en cuadernos, simplificará considerablemente estos casos prácticos tan importantes.”
Andrés Sopeña Pérez, director de ingeniería de contenido de Trivago
Dataplex Universal Catalog
Simplifica la exploración, la comprensión y la confianza de los datos de tu data lakehouse
Dataplex Universal Catalog es la solución de gobernanza unificada de datos para IA de Google Cloud. El catálogo basado en IA centraliza los metadatos empresariales, técnicos y operativos en Google Cloud y proporciona información valiosa basada en IA. Es compatible con formatos abiertos, como Apache Iceberg, para que puedas integrar la gobernanza en todo tu lakehouse.
“Dataplex ha sido fundamental para transformar nuestra plataforma de datos en un ecosistema de datos seguro, eficiente y escalable. Nos centramos en la gobernanza de datos, el descubrimiento, la observabilidad y el cumplimiento de las normativas de seguridad, por lo que estamos preparados para afrontar los retos de la gestión de datos en la era digital. Dataplex permite a nuestros equipos aprovechar todo el potencial de los datos y fomentar el crecimiento e innovación continuos de Box.Inc.”
Asmita Kulkarni, responsable sénior de producto de Box.Inc
BigQuery Studio y extensiones de IDE
Mejorar Apache Spark para cargas de trabajo avanzadas de ciencia de datos y de IA y aprendizaje automático en arquitecturas de lakehouse optimizando el desarrollo y las operaciones
Dataproc mejora Spark para IA y aprendizaje automático en lakehouses con nuevas innovaciones para entornos de ejecución de aprendizaje automático con controladores de GPU y bibliotecas de aprendizaje automático habituales. Los cuadernos de Colab Enterprise en BigQuery Studio y los entornos de desarrollo integrados (IDE) de terceros proporcionan MLOps integradas con Vertex AI y flujos de procesamiento de producción optimizados para agilizar la ciencia de datos.
“Shopify ha invertido en la contratación de un equipo con un conjunto diverso de habilidades para mantenerse a la vanguardia de las tendencias en ciencia e ingeniería de datos. En las primeras pruebas con BigQuery Studio, nos gustó la capacidad de Google para conectar diferentes herramientas para diferentes usuarios en una experiencia simplificada. Vemos esta situación como una oportunidad para reducir las fricciones en nuestro equipo sin renunciar a la escalabilidad que esperamos de BigQuery.”
Zac Roberts, director de ingeniería de datos de Shopify
Lectura de 10 minutos
Lectura de 10 minutos
Lectura de 10 minutos
Lectura de 15 minutos
10 minutos
Lectura de 15 minutos