Crea un data lakehouse abierto, administrado e inteligente en Google Cloud

Unifica y administra tus datos multimodales con un data lakehouse de alto rendimiento que se integra en la IA líder de la industria de Google. Aprovecha al máximo Apache Iceberg y el primer Spark sin servidores con ajuste de escala automático de la industria para simplificar las iniciativas de IA, estadísticas y procesamiento de datos.

Lleva el poder de Google a tu lakehouse de datos abiertos

Las nuevas innovaciones en los formatos de datos abiertos, la administración inteligente de datos a IA, el procesamiento de datos acelerado y las herramientas de desarrollo avanzadas asistidas por IA se combinan para optimizar la administración de datos y acelerar la innovación.

BigLake

Obtén la apertura de Apache Iceberg con la administración de almacenamiento de nivel empresarial

BigLake proporciona un motor de almacenamiento de Iceberg nativo para la interoperabilidad de Cloud Storage, ofrece una administración de metadatos de tiempo de ejecución unificada, permite análisis y ciencia de datos avanzados, y proporciona una administración de datos automatizada con administración integrada. Cualquier motor compatible con Iceberg puede usar la administración de tablas automatizada de BigLake para mejorar el rendimiento de las consultas y reducir los costos.


“La asociación con Google Cloud fue fundamental en nuestro recorrido para crear el lakehouse abierto de última generación de Snap y democratizar Spark y Iceberg en nuestra comunidad de desarrolladores.”

Zhengyi Liu, gerente sénior, ingeniero de software, Snap

BigLake

Obtén la apertura de Apache Iceberg con la administración de almacenamiento de nivel empresarial

BigLake proporciona un motor de almacenamiento de Iceberg nativo para la interoperabilidad de Cloud Storage, ofrece una administración de metadatos de tiempo de ejecución unificada, permite análisis y ciencia de datos avanzados, y proporciona una administración de datos automatizada con administración integrada. Cualquier motor compatible con Iceberg puede usar la administración de tablas automatizada de BigLake para mejorar el rendimiento de las consultas y reducir los costos.


“La asociación con Google Cloud fue fundamental en nuestro recorrido para crear el lakehouse abierto de última generación de Snap y democratizar Spark y Iceberg en nuestra comunidad de desarrolladores.”

Zhengyi Liu, gerente sénior, ingeniero de software, Snap

Google Cloud sin servidores para Apache Spark

Spark sin servidores ofrece un rendimiento alto y un procesamiento ultrarrápido, sin necesidad de administrar clústeres

Transforma tu lakehouse con Google Cloud sin servidores para Apache Spark. Experimenta un inicio rápido y cero sobrecarga operativa mientras mejoras el rendimiento de tus cargas de trabajo de Spark con el nuevo Lightning Engine. Esta poderosa combinación con Gemini aumenta la productividad y ofrece un TCO hasta un 60% más bajo.


“Consideramos que SQL y Spark son dos formas complementarias de acceder a los datos y transformarlos. Spark es especialmente útil para nosotros en casos de uso que requieren una lógica empresarial compleja, que, aunque es de nicho, es extremadamente fundamental para la empresa. Tener una plataforma unificada para SQL, Spark y la IA, con la experiencia de desarrollo en notebooks, simplificará considerablemente estos casos de uso fundamentales.”

Andrés Sopeña Pérez, director de Ingeniería de Contenido, Trivago

Dataplex Universal Catalog

Simplifica el descubrimiento de datos, la comprensión y la confianza para tu data lakehouse

Dataplex Universal Catalog es la solución de administración unificada de datos a IA para Google Cloud. El catálogo potenciado por IA centraliza los metadatos empresariales, técnicos y operativos en Google Cloud y proporciona estadísticas potenciadas por IA. Es compatible con formatos abiertos como Apache Iceberg para habilitar la administración integrada en todo tu lakehouse.


“Dataplex fue fundamental para transformar nuestra plataforma de datos en un ecosistema de datos seguro, eficiente y escalable. Con un enfoque en la administración de datos, el descubrimiento, la observabilidad y el cumplimiento de la seguridad, estamos preparados para enfrentar los desafíos de la administración de datos en la era digital. Dataplex permite que nuestros equipos aprovechen todo el potencial de los datos y fomenten la innovación y el crecimiento continuos de Box.Inc.”

Asmita Kulkarni, gerente sénior de Productos, Box.Inc

BigQuery Studio y extensiones de IDE

Mejora de Apache Spark para cargas de trabajo avanzadas de IA/AA y ciencia de datos en arquitecturas de lakehouse mediante la optimización del desarrollo y las operaciones

Dataproc mejora Spark para IA/AA en lakehouses con innovaciones nuevas para entornos de ejecución de AA con controladores de GPU y bibliotecas de AA comunes. Los notebooks de Colab Enterprise en BigQuery Studio y los IDE de terceros proporcionan MLOps integrados con Vertex AI y canalizaciones de producción optimizadas para acelerar la ciencia de datos.


“Shopify invirtió en un equipo con una variedad de habilidades para mantenerse a la vanguardia de las tendencias de ingeniería y ciencia de datos. En las pruebas iniciales con BigQuery Studio, nos gustó la capacidad de Google de conectar diferentes herramientas para diferentes usuarios en una experiencia simplificada. Vemos esto como una oportunidad para reducir la fricción en nuestro equipo sin sacrificar la escala que esperamos de BigQuery.”

Zac Roberts, administrador de ingeniería de datos, Shopify

Comienza tu recorrido de data lakehouse hoy mismo

Ya sea que estés migrando sistemas heredados o creando una arquitectura de lakehouse enfocada en Iceberg, Google Cloud tiene la tecnología para ayudarte a crear un lakehouse abierto, administrado y listo para la IA.


Google Cloud