TL;DR: Pinax が提供するデータセットを使用してブロックチェーン データを効率的に分析する方法を学びます。当社のソリューションが、Parquet ファイルや Snowflake などの管理されたデータベースを介して ETH データへのアクセスを簡素化し、SQL クエリを実行して毎日のアクティブ ユーザーや上位の契約アクティビティなどの貴重な洞察を抽出できるようにする方法を学びましょう。
私たちは、ブロックチェーン データ分析を変える製品、Snowflake と統合された Datasets on The Graph をデモできることを嬉しく思います。この投稿では、私たちが解決している問題、革新的なソリューション、人々が私たちのデータセットをどのように利用しているか、そして私たちの将来のビジョンについて探っていきます。

動画リンク:https://youtu.be/7CxFGgNmu-Y
データセットの詳細については、次の記事をご覧ください。
ブロックチェーンは、サイズが大きく管理が難しい大量のデータを生成します。このデータを抽出するには、特に RPC ノードからの詳細な対話に関しては、カスタム インストルメンテーションが必要です。
SQL などの従来のツールに慣れているアナリストは、ブロックチェーン データ抽出の複雑さに対処するのに苦労しています。複数のブロックチェーン ネットワークを処理するという課題と相まって、運用上の負担になります。
このデータに効率的にアクセスするということは、大規模なデータ セットをダウンロードする必要性を最小限に抑えることも意味します。そのため、必要なデータのみをクエリできるように、データ ストレージをサポートするソリューションが必要です。
SQL などの従来のツールに慣れているアナリストは、ブロックチェーン データ抽出の複雑さに対処するのに苦労しています。複数のブロックチェーン ネットワークを処理するという課題と相まって、運用上の負担になります。
このデータに効率的にアクセスするということは、大規模なデータ セットをダウンロードする必要性を最小限に抑えることも意味します。そのため、必要なデータのみをクエリできるように、データ ストレージをサポートするソリューションが必要です。
私たちはFirehoseとSubstreamsという 2 つの強力なテクノロジーを活用しています。これらのサービスは The Graph 上で実行され、ブロックチェーン データの効率的な抽出と保存を可能にします。まず、さまざまなチェーンのブロック アーキテクチャ (EVM、Solana、BTC に基づく) を定義し、次にそれらを Parquet ファイル (基本的にはデータベース プロパティを持つフラット ファイル) としてエクスポートします。これらのファイルは、AWS S3 またはその他の S3 互換バケットでホストされます。
データにアクセスしやすくするために、私たちは生のストレージにとどまりません。 Snowflake Marketplace のデータもリストします。 S3 から生データをクエリすることも、マネージド データベース Snowflake に直接接続して、マネージド データセットに対して SQL クエリを実行することもできます。この多用途性により、好きな方法でブロックチェーン データにアクセスできます。
データにアクセスするには、いくつかのオプションがあります。あなたはできる:
- 外部テーブルまたは直接コピー方法を使用して、S3 から生データをデータベースにロードします。
- SQL を使用して、Snowflake などのマネージド データベース内のデータを直接クエリします。
- Polars や pandas などの Python ライブラリを使用して、プログラムで単一の Parquet ファイルを読み取ります。

---ビデオ スライドショー、MVP アーキテクチャのデータ パイプラインのスクリーンショット。
データ パイプラインは Firehose から始まります。Firehose は、サブストリームを流れる標準化されたブロック タイプを作成するブロックチェーン データセットのインストルメンテーションをサポートします。ここでは、さまざまなデータ型 (ブロック、トランザクション追跡、ログ) のスキーマを定義し、それらを Parquet ファイルに変換します。
抽出されたデータは S3 でホストされ、SQL 計算エンジンや Python ライブラリなどのさまざまな方法で使用できます。また、次の 2 つの異なるゲートウェイ方式もサポートしています。
- リクエスタの支払い: S3 ストレージの使用量に基づいて請求が行われるため、アクセスした特定のデータ量に対して支払うことができます。
- Snowflake Marketplace: コピーせずにデータセットに直接アクセスし、SQL 対応のマネージド データベースのさらなる利便性を享受できます。

---ビデオ スライドショー、MVP アーキテクチャのゲートウェイのスクリーンショット。
Snowflake は、データセットを簡単に見つけられるマーケットプレイスを提供します。たとえば、「イーサリアム」を検索すると、有名なデータプロバイダーのリストが表示されます。当社のイーサリアム データセットは無料で試用でき、掲載料もかかりません。
ブロック、ログ、トランザクション ハッシュなどのテーブルを表示することで、データをプレビューしてその構造を理解することができます。現在、Snowflake はこのデータを単一リージョン (バージニア北部、米国東部) でホストしていますが、将来的には必要に応じてさらにリージョンを追加する予定です。
ブロック、ログ、トランザクション ハッシュなどのテーブルを表示することで、データをプレビューしてその構造を理解することができます。現在、Snowflake はこのデータを単一リージョン (バージニア北部、米国東部) でホストしていますが、将来的には必要に応じてさらにリージョンを追加する予定です。
私たちのデモでは、Snowflake の Python ノートブックを使用してイーサリアム上の毎日のアクティブ ユーザーを分析し、パンダを使用してデータを視覚化する方法を示します。また、活動別に上位の契約を調査し、契約レベルの詳細をドリルダウンするのがいかに簡単であるかを強調します。
現在、Snowflake と S3 でイーサリアムをホストしています。当社は、Base、Arbitrum、BSC、Polygon などの他の EVM チェーンや、Solana や BTC などの非 EVM チェーンをサポートするよう積極的に拡張しています。さらに、データの更新頻度を 24 時間から可能な限り低く抑え、ほぼリアルタイムの分析を実現することを目指しています。
私たちは、製品の構築と成長を継続し、より多くのブロックチェーンのサポートを拡大し、リアルタイム機能を強化して、アナリストから開発者まで、誰もがブロックチェーン データにアクセスできるようにすることに興奮しています。
お客様からのフィードバックと、Snowflake でのデータセット パイロットの成功に基づいて、将来、データセットが The Graph で完全にサポートされるデータ サービスとして表示される可能性があります。
お客様のニーズに基づいてブロックチェーン データ アクセスを簡素化する方法に興味がある場合は、当社の Web サイトにアクセスするか、直接お問い合わせください。デモをリクエストして、ブロックチェーン データへの洞察を得る方法をどのように変えることができるかを確認してください。
(関連する専門用語、コメント、コード ライブラリ、ハイパーリンクなどについては、ブログを参照してください)
簡単なヒントとして、ETH データセットは Snowflake で無料トライアルで利用できます。
💡 この記事は次の質問に答えます。
- ブロックチェーン データセットとは何ですか?
- アナリストは Snowflake でホストされているデータセットをどのように操作しますか?
- 一元化されたデータにアクセスするさまざまな方法にはどのようなものがありますか?
- ETH の限定された履歴データセットを無料で試すにはどうすればよいですか?
全てのコメント