データレイクハウス
Apache Iceberg はレイクハウスを実現しました。 PhoenixAI はそれを高速にします。レイクハウスのテーブルをサブセカンドのレイテンシでクエリ — ETL も、データ移動も、別途維持するウェアハウスも不要です。
DW speed
レイクハウスデータ上で
ウェアハウスへデータをコピーせずに
0
必要な ETL ジョブ
その場でクエリ
0
データ移動
レイクからウェアハウスへのパイプライン不要
課題
レイクハウスのクエリ課題
PhoenixAI なら
機能
PhoenixAI が Apache Iceberg アーキテクチャにもたらすもの。
Apache Iceberg などのレイクハウステーブル上でのネイティブ実行により、レイクのテーブルへ直接、データウェアハウス並みのパフォーマンスを提供します — コピーは不要です。
メモリとローカル SSD にまたがる階層型キャッシュが、サブセカンドの Apache Iceberg クエリを実現します。すべてのデータは信頼できる唯一の情報源としてレイクに永続化されます。
リアルタイムのストリーミングデータと履歴のレイクハウステーブルを、同一の SQL クエリで結合または UNION できます。フェデレーションのオーバーヘッドも、レイヤーごとの個別エンジンも不要です。
Apache Iceberg テーブル上でホットデータを事前計算します。クエリは Iceberg テーブル全体をスキャンする代わりに、自動的に書き換えられて MV を参照します — マルチペタバイトのファクトテーブルでもサブセカンドの応答を実現します。
PhoenixAI は、オープンテーブルフォーマット、オブジェクトストレージ、カタログ、そしてレイクハウスにデータを供給する処理エンジンと統合します。
オープンテーブルフォーマット
オブジェクトストレージ
カタログ・プラットフォーム
本番環境で
“当社は世界150万軒以上のホテルの予約サービスを提供しています。PhoenixAI を採用したことで、平均クエリ応答速度 200ミリ秒という高速なデータ分析を実現しました。統合されたデータ分析アーキテクチャのおかげで、人的コストとハードウェアコストが大幅に削減されています。”
Trip.com Group
PhoenixAI のお客様
200ミリ秒
平均クエリ応答