Google Cloud でオープンで管理されたインテリジェントなデータ レイクハウスを構築する

Google の業界をリードする AI と統合された高性能データ レイクハウスで、マルチモーダル データを統合して管理します。Apache Iceberg と、業界初の自動スケーリング サーバーレス Spark を最大限に活用して、データ処理、分析、AI イニシアチブを簡素化します。

Google の機能をオープン データ レイクハウスに活用

オープン データ形式の新しいイノベーション、インテリジェント データから AI へのガバナンス、データ処理の高速化、高度な AI 支援開発ツールがすべて組み合わさることで、データ管理が効率化され、イノベーションが加速します。

BigLake

エンタープライズ グレードのストレージ管理で Apache Iceberg のオープン性を実現

BigLake は、Cloud Storage の相互運用性のためのネイティブな Iceberg ストレージ エンジンを提供し、統合されたランタイム メタデータ管理、高度な分析とデータ サイエンス、組み込みのガバナンスによる自動化されたデータ管理を実現します。Iceberg 対応のエンジンであれば、BigLake の自動テーブル管理を使用して、クエリのパフォーマンスを向上させ、費用を削減できます。


“Google Cloud とのパートナーシップは、Snap の次世代のオープンなレイクハウスを構築し、デベロッパー コミュニティで Spark と Iceberg を民主化するための取り組みに大いに役立っています。”

Snap、シニア マネージャー、ソフトウェア エンジニア、Zhengyi Liu 氏

BigLake

エンタープライズ グレードのストレージ管理で Apache Iceberg のオープン性を実現

BigLake は、Cloud Storage の相互運用性のためのネイティブな Iceberg ストレージ エンジンを提供し、統合されたランタイム メタデータ管理、高度な分析とデータ サイエンス、組み込みのガバナンスによる自動化されたデータ管理を実現します。Iceberg 対応のエンジンであれば、BigLake の自動テーブル管理を使用して、クエリのパフォーマンスを向上させ、費用を削減できます。


“Google Cloud とのパートナーシップは、Snap の次世代のオープンなレイクハウスを構築し、デベロッパー コミュニティで Spark と Iceberg を民主化するための取り組みに大いに役立っています。”

Snap、シニア マネージャー、ソフトウェア エンジニア、Zhengyi Liu 氏

Apache Spark 用 Google Cloud Serverless

サーバーレス Spark は、クラスタ管理を必要とせず、高パフォーマンスで超高速な処理を実現

Google Cloud Serverless for Apache Spark でレイクハウスを変革します。新しい Lightning Engine で、Spark ワークロードのパフォーマンスを向上させながら、迅速な起動とゼロ運用のオーバーヘッドを実現できます。Gemini との組み合わせにより、生産性が向上し、TCO を最大 60% 削減できます。


“私たちは、SQL と Spark を、データにアクセスして変換する 2 つの補完的な方法と考えています。Spark は、ニッチであるものの、ビジネスにとって非常に重要な複雑なビジネス ロジックを必要とするユースケースで特に役立ちます。SQL、Spark、AI の統合プラットフォームとノートブックでの開発エクスペリエンスがあれば、これらの重要なユースケースを大幅に簡素化できます。”

Trivago、コンテンツ エンジニアリング担当責任者、Andrés Sopeña Pérez 氏

Dataplex ユニバーサル カタログ

データ レイクハウスのデータ検出、理解、信頼を簡素化

Dataplex ユニバーサル カタログは、Google Cloud 向けの統合データから AI へのガバナンス ソリューションです。AI を活用したカタログは、Google Cloud 全体のビジネス、技術、運用のメタデータを一元化し、AI を活用した分析情報を提供します。Apache Iceberg などのオープン形式をサポートし、レイクハウス全体にわたる統合されたガバナンスを実現します。


“Dataplex は、当社のデータ プラットフォームを安全で効率的、かつスケーラブルなデータ エコシステムに変革する上で重要な役割を果たしてきました。当社は、データ ガバナンス、検出、オブザーバビリティ、セキュリティ コンプライアンスに注力し、デジタル時代におけるデータ マネジメントの課題に対応するためのツールを手に入れました。Dataplex のおかげで、データの潜在能力を最大限に引き出し、Box.Inc の成長とイノベーションを継続することができています。”

Box.Inc、シニア プロダクト マネージャー Asmita Kulkarni 氏

BigQuery Studio と IDE 拡張機能

開発と運用を合理化して、レイクハウス アーキテクチャ内の高度なデータ サイエンスおよび AI/ML ワークロード向けに Apache Spark を強化

Dataproc は、GPU ドライバと一般的な ML ライブラリを使用した ML ランタイムの新しいイノベーションにより、レイクハウスで AI/ML 向けの Spark を進化させています。BigQuery Studio とサードパーティ IDE の Colab Enterprise ノートブックは、Vertex AI との統合 MLOps と合理化された本番環境パイプラインを提供し、データ サイエンスを加速します。


“「Shopify は、データ サイエンスやデータ エンジニアリングのトレンドの最先端に立ち続けるため、幅広いスキルセットを持つ人材の採用に投資してきました。BigQuery Studio の早期テストで、私たちは、ユーザーごとに異なるツールをシンプルに接続できる Google の能力がとても気に入りました。これは、BigQuery に期待しているスケールを犠牲にすることなくチーム内における非効率性を低減する良い機会だと考えています。」”

Shopify、データ エンジニアリング マネージャー Zac Roberts 氏

データ レイクハウスのツアーを今すぐ開始

レガシー システムの移行でも、Iceberg ファーストのレイクハウスの設計でも、Google Cloud には、オープンでマネージドの AI 対応のレイクハウスを構築するのに役立つテクノロジーがあります。


  • Google Cloud プロダクト
  • 100 種類を超えるプロダクトをご用意しています。新規のお客様には、ワークロードの実行、テスト、デプロイができる無料クレジット $300 分を差し上げます。また、すべてのお客様に 25 以上のプロダクトを無料でご利用いただけます(毎月の使用量上限があります)。
Google Cloud