お客様事例

Coinbase がダッシュボードの読み込み時間を 8秒から 80ミリ秒に短縮した方法

大規模な本番環境での実際の数値。

事例を読む

データレイクハウス

データをコピーせず、
レイクハウスをクエリ

Apache Iceberg はレイクハウスを実現しました。 PhoenixAI はそれを高速にします。レイクハウスのテーブルをサブセカンドのレイテンシでクエリ — ETL も、データ移動も、別途維持するウェアハウスも不要です。

DW speed

レイクハウスデータ上で

ウェアハウスへデータをコピーせずに

0

必要な ETL ジョブ

その場でクエリ

0

データ移動

レイクからウェアハウスへのパイプライン不要

課題

レイクハウスは保存に強く、クエリに弱い

レイクハウスのクエリ課題

インタラクティブクエリが遅く、データ移動を強いられる

Apache Iceberg への複雑な分析クエリが、数秒ではなく数分かかる
インタラクティブな性能を得るためだけに、ウェアハウスへデータをコピー
データが二重に存在: レイクに 1つ、ウェアハウスに 1つ
レイクとウェアハウス間の同期パイプラインが破綻し、乖離する

PhoenixAI なら

データウェアハウスの速度。データレイクの経済性。

Apache Iceberg テーブルへ直接、サブセカンドのクエリ
インテリジェントな階層型キャッシュ — コピー不要で、ウェアハウス並みの速度
信頼できる唯一の情報源 — 同期パイプラインもデータの乖離もなし
ストリーミングと履歴を同一クエリでクエリ

機能

レイクハウスに必要なクエリレイヤー

PhoenixAI が Apache Iceberg アーキテクチャにもたらすもの。

table_view

ネイティブなレイクハウス統合

Apache Iceberg などのレイクハウステーブル上でのネイティブ実行により、レイクのテーブルへ直接、データウェアハウス並みのパフォーマンスを提供します — コピーは不要です。

cached

インテリジェントな階層型キャッシュ

メモリとローカル SSD にまたがる階層型キャッシュが、サブセカンドの Apache Iceberg クエリを実現します。すべてのデータは信頼できる唯一の情報源としてレイクに永続化されます。

merge_type

ストリーミングと履歴を一度のクエリで

リアルタイムのストリーミングデータと履歴のレイクハウステーブルを、同一の SQL クエリで結合または UNION できます。フェデレーションのオーバーヘッドも、レイヤーごとの個別エンジンも不要です。

bolt

非同期マテリアライズドビュー

Apache Iceberg テーブル上でホットデータを事前計算します。クエリは Iceberg テーブル全体をスキャンする代わりに、自動的に書き換えられて MV を参照します — マルチペタバイトのファクトテーブルでもサブセカンドの応答を実現します。

レイクハウスと連携

PhoenixAI は、オープンテーブルフォーマット、オブジェクトストレージ、カタログ、そしてレイクハウスにデータを供給する処理エンジンと統合します。

オープンテーブルフォーマット

Apache IcebergDelta LakeApache Hudi

オブジェクトストレージ

Amazon S3Google GCSAzure ADLSMinIO

カタログ・プラットフォーム

AWS GlueHive MetastoreDatabricks Unity CatalogSnowflake Horizon CatalogAmazon S3 Tables

本番環境で

移行したレイクハウスチームの声

“当社は世界150万軒以上のホテルの予約サービスを提供しています。PhoenixAI を採用したことで、平均クエリ応答速度 200ミリ秒という高速なデータ分析を実現しました。統合されたデータ分析アーキテクチャのおかげで、人的コストとハードウェアコストが大幅に削減されています。”

T

Trip.com Group

PhoenixAI のお客様

200ミリ秒

平均クエリ応答

レイクハウスをリアルタイムにクエリ

PhoenixAI をお客様の Apache Iceberg テーブルに接続。クエリレイテンシがどうなるかをお見せします。