たとえば、階級の身長や体重、企業のダブルイレブンの経営状況、国の GDP とその動向など、皆さんに聞きたいのですが、「データ」とは何ですか?
おそらく誰もがすぐに定義を思いつき、一連のわかりやすい例を思いつくことができるでしょう。したがって、「データ」は私たちに非常に近いものであり、私たちが生成したり送信したりするほど近くにあり、私たちの生活の指針として依存できるほど近いものであると言えます。
しかし、それは私たちからはとても遠く離れたところにあるようで、個人に関する大量のデータが携帯電話やパソコンによって収集されたり、意味不明の0と1だらけの画面に簡略化されたり、未知のサーバーに分散して保存されたりしている。構造化された用語のまばゆいばかりの配列がカラフルなチャートにまとめられています。
プロデューサーとして、私たちがデータを理解し、管理することがますます困難になっているように思えます。
画像ソース: swyftx
NetEase Blockchainでは、この概念をより深く理解していただくために、 Web3.0時代の「データ」の捉え方と今後の動向について、データロジックを多角的に深掘りし、技術変革期におけるデータの重要性を分析し、パフォーマンス向上の理由を分析し、最も価値のあるデータの出現を説明し、データの価値を捉えるためのさまざまなシナリオを検討します。
データは流動的であり、不確実性の中で確実性を見つけることが最初の連載の目標です。 「データ」をオープンにする正しい方法に関する最初の記事では、Web 3.0 時代の到来と、それがデータの価値を保護し、理解し、さらには再構築できるかどうかについて説明します。
スパイラルは依然として残り、データ問題については議論が続いている
- データ転送の制限
データ ストレージとユーザー情報保護は、ユーザーにとって常に解決が困難でした。近年、データ漏洩事件により、データの収集と保管に対するユーザーの信頼が失われ続けています。ユーザーが個人情報を集中ストレージ施設にアップロードすると、情報の制御が失われることになります。この個人情報が紛失、漏洩、盗難されると、その個人は「社会的死」となります。
Facebookでは2013年以来、少なくとも5件のデータ侵害が発生している。 2019年の漏洩では5億4,000万のアカウントにも影響があったが、Facebookは漏洩は「古いデータ」であり、この事件に関してユーザーにいかなるアドバイスも提供しないと説明した。
2016 年 12 月 14 日、Yahoo は 2013 年に同社の 10 億を超えるユーザー アカウントがハッカーによって盗まれたと発表しました。盗まれた情報には、名前、連絡先情報、パスワード、秘密の質問と答えが含まれている可能性があり、翌年、Yahoo は 30 億人の Yahoo ユーザー全員の個人情報が漏洩したと発表したが、これは 2016 年に発表された数の 3 倍であった。
2016 年 12 月 14 日、Yahoo は 2013 年に同社の 10 億を超えるユーザー アカウントがハッカーによって盗まれたと発表しました。盗まれた情報には、名前、連絡先情報、パスワード、秘密の質問と答えが含まれている可能性があり、翌年、Yahoo は 30 億人の Yahoo ユーザー全員の個人情報が漏洩したと発表したが、これは 2016 年に発表された数の 3 倍であった。
データセキュリティ法および個人情報保護法の施行以来、当社はデータセキュリティと個人情報保護に対する要件をさらに厳格化してきました。 Web2.0はデータガバナンスに関して満足のいく答えを出していないと言える。
- データ活用の難しさ
ビッグ データとモノのインターネットの時代では、あらゆるものが歩く「データ」ソースと呼ぶことができます。このため、データ ストレージの増加率も驚異的です。2010 年から 2020 年にかけて、世界中で作成、コピー、消費されるデータが増えました。データ/情報の総量は 64.2 ZB であり、この数は増加しています。
Statista によると、2025 年までに 180 ZB を超えると予想されています。データ量のこのような驚くべき増加を考えると、将来、データのクリーニングと検査がどれほど困難になるかが想像できます。
これも、Web2.0 データアイランドによって引き起こされる悪影響の 1 つです。ユーザーはアプリを開くたびにわざわざ登録を行う必要があり、知らないうちにアプリに他の情報の取得を許可してしまう可能性があります。各アプリケーションは独自のユーザー データベースを制御します。データベースは互いに独立しており、相互に通信しません。
データの収集を繰り返すと、多くの時間、ネットワーク帯域幅、コンピューティング リソースが消費されるだけでなく、断片化された収集状態によってデータの包括的な分析やマイニングが制限され、データの潜在的な価値や洞察を発見することが困難になります。大量のデータの一意性と正確性は、異なるデータ ソース間の効率的な比較と検証による処理を待ちます。
データ利用者は完了するまでに多くの時間とリソースを費やす必要があり、プロバイダーは詳細なデータ収集方法、処理手順、または自己証明できない従来の宝くじや宝くじメカニズムなどのトレーサビリティ情報を提供できない、または提供したくない場合があります。ユーザーがデータの信頼性と信頼性を検証することがますます困難になります。
明らかに、データ流通制限の下での検査は、ユーザーにとって回避できない問題となっています。
- データ値のマッチング
Web2.0 により、より多くのユーザーが対話して Web コンテンツの作成に参加できるようになりますが、すべてのユーザーが一致する権利を取得しているわけではありません。ユーザー生成コンテンツは、ユーザーの定着率を高めるために使用されるだけでなく、プラットフォームによって所有されたり、商業目的で使用されたりすることもあります。
多くのプラットフォームは、広告のターゲティングや第三者へのデータ販売などを通じて、ユーザー データを収集および分析して、そこから商業的価値を得ることがあります。
画像ソース: swyftx
Twitter (現在は再販と呼ばれています。このプロセスでは、ユーザーは「データ ワーカー」とみなされ、ユーザー契約を意のままに変更するプラットフォームや企業が継続的に育成されます。このとき、ユーザーは製品そのものです。
Twitter (現在は再販と呼ばれています。このプロセスでは、ユーザーは「データ ワーカー」とみなされ、ユーザー契約を意のままに変更するプラットフォームや企業が継続的に育成されます。このとき、ユーザーは製品そのものです。
さらにビジョンのレベルを上げて、データの価値について議論してみましょう。最終的には、それが実用的であるか、希少であるか、正しいか、重要であるか、社会的および集団的価値に関わるかどうか、そしてそれが可能であるかどうかなど、複雑かつ多次元のプロセスです。データの価値分布に影響を与える要素には、ユーザーがもたらす潜在的なビジネスチャンスなども含まれます。
データの価値に対する認識や評価基準は業界や組織、個人によって異なるため、ユーザーがデータを提供した後にそれに応じた価値分布が得られたとしても、その価値を評価することは非常に困難です。
さらに、デジタル環境ではデータは簡単にコピーして配布することができ、他の参加者も同じデータにアクセスできるため、ユーザーがデータの内容にさらされると、データの固有の価値は大幅に低下します。
データ プロバイダーの場合、追加サービス、分析洞察、または他のデータ セットとの組み合わせを提供することでデータの価値を高めようとする場合がありますが、この時点で、データ価値の割り当てはメタデータのプロバイダーをバイパスするため、データの分散が発生します。値はより複雑になります。
Web 3.0 は破壊せずにデータの価値を再構築します
- データ ガバナンス: データを安全かつ制御可能にする
Web3.0 プロジェクトは、バックエンドとメタデータを分散ストレージに接続することの重要性を徐々に発見しています. Web3.0 チェーン上のデータは、通常、単一の集中サーバーに保存されるのではなく、複数のノードに分散されます。
一部のノードが攻撃されたり故障したりしても、他のノードは引き続きデータを提供できます。特にユーザーの個人情報、財務データ、機密性の高いビジネスデータに関しては、分散ストレージを使用することで、単一障害点や集中ストレージの潜在的なセキュリティリスクを回避し、ユーザーデータの損傷を回避できます。
また、新たな AI テクノロジーを使用して、データの保管および流通中に発生するセキュリティ問題を迅速に調査することもできます。
AI 駆動の侵入検知システムは、動作モデルとルール エンジンを確立することで脆弱性スキャンを自動的に実行し、ブルート フォース ログイン試行やその他の悪意のあるアクティビティなど、オンライン データ内の異常な動作をリアルタイムで監視し、早期に警告します。また、AI は継続的な機械学習を通じてネットワークの脅威に対する防御能力を向上させ、攻撃パターン、新たな脅威、脆弱性情報を分析し、継続的に自己学習して防御戦略を更新することで、変化する脅威環境にタイムリーに適応します。
画像ソース: swyftx
プライバシーを完全に保護することに基づいてデータを徹底的にマイニングすることは、デジタル経済の発展に不可欠な部分です。「より良いプレイのためのデータ基本システムの構築に関する中国共産党中央委員会と国務院の意見」 2022年末にリリースされた「データ要素の役割」により、データは「利用できない。見えるようにする」ことが法的要件となった。
データ流通におけるセキュリティ問題を解決するためにプライバシー コンピューティング技術を使用することは、必要な技術とソリューションになっています。
プライベート コンピューティング テクノロジーにより、元のデータを公開することなく計算と分析が可能になり、機密データのプライバシーが保護されます。欧州連合サイバーセキュリティ庁 (ENISA) は、「プライバシー強化テクノロジー」を、プライバシーとデータ保護の中核原則の中でも特に、データの最小化、匿名化、仮名化をサポートするように設計されたテクノロジーと定義しています。
主要な技術ラインの 1 つであるゼロ知識証明 (ZKP) を例に挙げると、証明者は、情報の実際の内容を明らかにすることなく、特定の情報を所有していることを検証者に示すことができます。証明プロセス中、データのアクセス権と使用権は必要に応じて正確に制御でき、検証者はゼロ知識証明から証明者に関する実際の情報を取得できません。
主要な技術ラインの 1 つであるゼロ知識証明 (ZKP) を例に挙げると、証明者は、情報の実際の内容を明らかにすることなく、特定の情報を所有していることを検証者に示すことができます。証明プロセス中、データのアクセス権と使用権は必要に応じて正確に制御でき、検証者はゼロ知識証明から証明者に関する実際の情報を取得できません。
したがって、データ主体は、個人のプライバシー情報を明らかにすることなく、ゼロ知識証明を通じて特定の属性または資格を所有していることをアプリケーションに証明できます。アプリケーションは、特定のデータを知らなくても証明の有効性を検証できます。
この特性により、ゼロ知識証明はユーザーのプライバシーと認証を保護し、ユーザーとアプリケーション間のデータ信頼の橋渡しをするための強力なツールになります。同時に、プライバシー コンピューティング テクノロジーは、安全なデータ共有と協力を実現し、データ流通の障壁を打ち破る可能性も生み出します。
セキュア コンピューティング プロトコルを通じて、さまざまな組織が元のデータを共有することなく分散モデルの推論やトレーニングを実行できると同時に、データ プロバイダーの知的財産権を保護し、データ要素が信頼に基づいて完全に循環できるようにし、組織間のデータ協力と提供を行うことができます。コンプライアンスにより、より多くの機会と柔軟性が提供され、国の規制に準拠した同じ業界の企業間および業界を超えたデータ アライアンスが促進されます。
実際のビジネス シナリオに適用されるプライバシー コンピューティング テクノロジーは、反復コストや安定性などの課題に直面していますが、テクノロジーの継続的な開発により、データ市場のインフラストラクチャは徐々に改善および成熟し、データ独占とプライバシー セキュリティが解決されるでしょう。コーナー。
- データの価値: ユーザーが一緒に作成して共有できるようにする
Web3.0 の中核となる概念の 1 つは、データの所有権と価値の帰属の変革です。
蓄積されたすべてのオンチェーンインタラクション行動データについて、ユーザーはこれに基づいて生み出された価値を公平に享受できます データはリソースから、確認され、流動的で利益をもたらす個人資産へと進化しました インセンティブモデルは、創造性を刺激し報酬を与えることを目的としていますこれは、Web1.0 や Web2.0 の段階ではまったく想像もできなかったことでした。
データの価値が真に流れるようにするには、まず各チェーン上のデータの所有権を確認できます。ブロックチェーン上のデータ取引と所有権の移転は完全に公開されており、プラットフォーム間を流れることができ、元のデータ作成者の権利と利益は完全に保護されます。
このため、プロデューサーはスマート コントラクトを通じてデータの使用と共有のルールを定義し、データの付加価値と使用シナリオに基づいてさまざまなライセンス契約を策定して、追加のサービスとデータ セットの組み合わせの使用から合理的な利益を確保することができます。
第二に、データ資産の円滑な流通の前提条件は、データ要素市場の育成を完了することです。この目的のために、上海データ取引所は、データプロバイダーシステムのリリースや、データ取引エンティティ、データコンプライアンスコンサルティング、品質評価、資産評価、新しいビジネス形式は、難しいデータ価格設定の問題を解決し、デジタル利益を最大限に引き出します。
[NetEase Planet 5th Anniversary Special] デジタル資産を含む複数のデジタル コレクション シリーズが上海データ取引所に登録されており、デジタル資産関連のコンテンツと権利は「中国デジタル資産ネットワーク」に表示されます。
今年に入ってから、上海データ取引所のデータ取引量は増加を続けており、月間取引量は1億元を超え、2023年には年間取引量が10億元を超えると予想されており、リストされているデータ製品は 1,600 を超え、金融、海運、輸送、国際をカバーしています。他の分野でも、ますます活発な市場取引エコシステムが徐々に形成されてきています。
Web3.0 は、価値インセンティブ部分の新しい探求の道も提案しています。つまり、プロデューサーとユーザーの両方が、DAO を通じてデータの使用と配布の意思決定とガバナンスに参加できます。
Web3.0 は、価値インセンティブ部分の新しい探求の道も提案しています。つまり、プロデューサーとユーザーの両方が、DAO を通じてデータの使用と配布の意思決定とガバナンスに参加できます。
インセンティブ メカニズムを設定して、データ参加者の貢献に報酬を与えます。たとえば、データ貢献、データ品質、データ検証などにおけるデータ参加者の貢献は、貢献アルゴリズムやその他のメカニズムを通じて評価され、報酬が与えられます。これにより、データ参加者は公正な利益を確実に受け取りながら、データ サイクル ガバナンスに参加するよう奨励されます。
権利保護、コンプライアンス、持続可能性の問題を段階的に解決しながら、新しいエコロジカル アーキテクチャ DAO を通じて、データ価値の配布に関するより広範な参照とコンセンサスを提供できることを楽しみにしています。
まとめ
Web 3.0は、さまざまな技術ルートを統合する革命であり、人工知能やブロックチェーン技術などの新興テクノロジーの組み合わせによって再構築される、透明性、安全性、価値創造性を備えたオンラインエコシステムは、将来的にエキサイティングな新しいビジネスモデルを生み出します。シナリオ。
データという基本的な柱については、より多くの一般ユーザーが生産手段としてだけでなく生産性としてもデータを享受し、ユーザーエクスペリエンスに質的な変化をもたらすことを期待しています。
参照元:
[1] Web3 データ トラックを 1 つの記事で理解します: 市場構造、代表的なプロジェクト、将来の傾向。
[2] プライベート コンピューティング パブリック チェーンの信頼できる将来に関する詳細な議論 [3] プライバシー コンピューティング ホワイト ペーパー (2022)。
[4] 10,000 ワードの長文記事: Web3 データ市場の展望。
[5] 公平性理論に基づくフェデレーションラーニングの公平な報酬分配方法。
[6] 上海データ交換の「秘密の暴露」: データ要素の流通に関する「必ず答えなければならない質問」。
全てのコメント