Crea un data lakehouse abierto, administrado e inteligente en Google Cloud
Unifica y administra tus datos multimodales con un data lakehouse de alto rendimiento que se integra en la IA líder de la industria de Google. Aprovecha al máximo Apache Iceberg y el primer Spark sin servidores con ajuste de escala automático de la industria para simplificar las iniciativas de IA, estadísticas y procesamiento de datos.
Las nuevas innovaciones en los formatos de datos abiertos, la administración inteligente de datos a IA, el procesamiento de datos acelerado y las herramientas de desarrollo avanzadas asistidas por IA se combinan para optimizar la administración de datos y acelerar la innovación.
BigLake
Obtén la apertura de Apache Iceberg con la administración de almacenamiento de nivel empresarial
BigLake proporciona un motor de almacenamiento de Iceberg nativo para la interoperabilidad de Cloud Storage, ofrece una administración de metadatos de tiempo de ejecución unificada, permite análisis y ciencia de datos avanzados, y proporciona una administración de datos automatizada con administración integrada. Cualquier motor compatible con Iceberg puede usar la administración de tablas automatizada de BigLake para mejorar el rendimiento de las consultas y reducir los costos.
“La asociación con Google Cloud fue fundamental en nuestro recorrido para crear el lakehouse abierto de última generación de Snap y democratizar Spark y Iceberg en nuestra comunidad de desarrolladores.”
Zhengyi Liu, gerente sénior, ingeniero de software, Snap
Google Cloud sin servidores para Apache Spark
Spark sin servidores ofrece un rendimiento alto y un procesamiento ultrarrápido, sin necesidad de administrar clústeres
Transforma tu lakehouse con Google Cloud sin servidores para Apache Spark. Experimenta un inicio rápido y cero sobrecarga operativa mientras mejoras el rendimiento de tus cargas de trabajo de Spark con el nuevo Lightning Engine. Esta poderosa combinación con Gemini aumenta la productividad y ofrece un TCO hasta un 60% más bajo.
“Consideramos que SQL y Spark son dos formas complementarias de acceder a los datos y transformarlos. Spark es especialmente útil para nosotros en casos de uso que requieren una lógica empresarial compleja, que, aunque es de nicho, es extremadamente fundamental para la empresa. Tener una plataforma unificada para SQL, Spark y la IA, con la experiencia de desarrollo en notebooks, simplificará considerablemente estos casos de uso fundamentales.”
Andrés Sopeña Pérez, director de Ingeniería de Contenido, Trivago
Dataplex Universal Catalog
Simplifica el descubrimiento de datos, la comprensión y la confianza para tu data lakehouse
Dataplex Universal Catalog es la solución de administración unificada de datos a IA para Google Cloud. El catálogo potenciado por IA centraliza los metadatos empresariales, técnicos y operativos en Google Cloud y proporciona estadísticas potenciadas por IA. Es compatible con formatos abiertos como Apache Iceberg para habilitar la administración integrada en todo tu lakehouse.
“Dataplex fue fundamental para transformar nuestra plataforma de datos en un ecosistema de datos seguro, eficiente y escalable. Con un enfoque en la administración de datos, el descubrimiento, la observabilidad y el cumplimiento de la seguridad, estamos preparados para enfrentar los desafíos de la administración de datos en la era digital. Dataplex permite que nuestros equipos aprovechen todo el potencial de los datos y fomenten la innovación y el crecimiento continuos de Box.Inc.”
Asmita Kulkarni, gerente sénior de Productos, Box.Inc
BigQuery Studio y extensiones de IDE
Mejora de Apache Spark para cargas de trabajo avanzadas de IA/AA y ciencia de datos en arquitecturas de lakehouse mediante la optimización del desarrollo y las operaciones
Dataproc mejora Spark para IA/AA en lakehouses con innovaciones nuevas para entornos de ejecución de AA con controladores de GPU y bibliotecas de AA comunes. Los notebooks de Colab Enterprise en BigQuery Studio y los IDE de terceros proporcionan MLOps integrados con Vertex AI y canalizaciones de producción optimizadas para acelerar la ciencia de datos.
“Shopify invirtió en un equipo con una variedad de habilidades para mantenerse a la vanguardia de las tendencias de ingeniería y ciencia de datos. En las pruebas iniciales con BigQuery Studio, nos gustó la capacidad de Google de conectar diferentes herramientas para diferentes usuarios en una experiencia simplificada. Vemos esto como una oportunidad para reducir la fricción en nuestro equipo sin sacrificar la escala que esperamos de BigQuery.”
Zac Roberts, administrador de ingeniería de datos, Shopify
BigLake
Obtén la apertura de Apache Iceberg con la administración de almacenamiento de nivel empresarial
BigLake proporciona un motor de almacenamiento de Iceberg nativo para la interoperabilidad de Cloud Storage, ofrece una administración de metadatos de tiempo de ejecución unificada, permite análisis y ciencia de datos avanzados, y proporciona una administración de datos automatizada con administración integrada. Cualquier motor compatible con Iceberg puede usar la administración de tablas automatizada de BigLake para mejorar el rendimiento de las consultas y reducir los costos.
“La asociación con Google Cloud fue fundamental en nuestro recorrido para crear el lakehouse abierto de última generación de Snap y democratizar Spark y Iceberg en nuestra comunidad de desarrolladores.”
Zhengyi Liu, gerente sénior, ingeniero de software, Snap
Google Cloud sin servidores para Apache Spark
Spark sin servidores ofrece un rendimiento alto y un procesamiento ultrarrápido, sin necesidad de administrar clústeres
Transforma tu lakehouse con Google Cloud sin servidores para Apache Spark. Experimenta un inicio rápido y cero sobrecarga operativa mientras mejoras el rendimiento de tus cargas de trabajo de Spark con el nuevo Lightning Engine. Esta poderosa combinación con Gemini aumenta la productividad y ofrece un TCO hasta un 60% más bajo.
“Consideramos que SQL y Spark son dos formas complementarias de acceder a los datos y transformarlos. Spark es especialmente útil para nosotros en casos de uso que requieren una lógica empresarial compleja, que, aunque es de nicho, es extremadamente fundamental para la empresa. Tener una plataforma unificada para SQL, Spark y la IA, con la experiencia de desarrollo en notebooks, simplificará considerablemente estos casos de uso fundamentales.”
Andrés Sopeña Pérez, director de Ingeniería de Contenido, Trivago
Dataplex Universal Catalog
Simplifica el descubrimiento de datos, la comprensión y la confianza para tu data lakehouse
Dataplex Universal Catalog es la solución de administración unificada de datos a IA para Google Cloud. El catálogo potenciado por IA centraliza los metadatos empresariales, técnicos y operativos en Google Cloud y proporciona estadísticas potenciadas por IA. Es compatible con formatos abiertos como Apache Iceberg para habilitar la administración integrada en todo tu lakehouse.
“Dataplex fue fundamental para transformar nuestra plataforma de datos en un ecosistema de datos seguro, eficiente y escalable. Con un enfoque en la administración de datos, el descubrimiento, la observabilidad y el cumplimiento de la seguridad, estamos preparados para enfrentar los desafíos de la administración de datos en la era digital. Dataplex permite que nuestros equipos aprovechen todo el potencial de los datos y fomenten la innovación y el crecimiento continuos de Box.Inc.”
Asmita Kulkarni, gerente sénior de Productos, Box.Inc
BigQuery Studio y extensiones de IDE
Mejora de Apache Spark para cargas de trabajo avanzadas de IA/AA y ciencia de datos en arquitecturas de lakehouse mediante la optimización del desarrollo y las operaciones
Dataproc mejora Spark para IA/AA en lakehouses con innovaciones nuevas para entornos de ejecución de AA con controladores de GPU y bibliotecas de AA comunes. Los notebooks de Colab Enterprise en BigQuery Studio y los IDE de terceros proporcionan MLOps integrados con Vertex AI y canalizaciones de producción optimizadas para acelerar la ciencia de datos.
“Shopify invirtió en un equipo con una variedad de habilidades para mantenerse a la vanguardia de las tendencias de ingeniería y ciencia de datos. En las pruebas iniciales con BigQuery Studio, nos gustó la capacidad de Google de conectar diferentes herramientas para diferentes usuarios en una experiencia simplificada. Vemos esto como una oportunidad para reducir la fricción en nuestro equipo sin sacrificar la escala que esperamos de BigQuery.”
Zac Roberts, administrador de ingeniería de datos, Shopify
Lectura de 10 min
Lectura de 10 min
Lectura de 10 min
Lectura de 15 min
10 min
Lectura de 15 min