Cointime

Download App
iOS & Android

AI は暗号通貨のエージェントです: AI エージェントの進化

Cointime Official

作者: ズオ・イエ

芸術作品は決して完成することはなく、放棄されるだけです。

誰もが AI エージェントについて話していますが、話している内容は同じではありません。これは、私たちが関心を持っている AI エージェントと一般の視点、および AI 実践者の視点との違いにつながります。

ずっと前に、私は「暗号は AI の幻想である」と書きましたが、当時から現在に至るまで、暗号と AI の組み合わせは報われない愛であり、AI の専門家が Web3/ブロックチェーンという用語を言及することはめったにありません。しかし、私は AI に情熱を持っており、AI エージェント フレームワークがトークン化できるという驚異を知った後、それが本当に AI 実践者を私たちの世界に導入できるかどうかはわかりません。

AI はクリプトの代理人である これは、今回の AI の急増をクリプトの観点から見るための最良の説明です。特に、クリプトの AI に対する熱意は、金融資産の発行と運用を統合することを望んでいます。

エージェントの進化、原点はテクニカルマーケティング

そのルーツを調査すると、AI エージェントには少なくとも 3 つのソースがあり、OpenAI の AGI (General Artificial Intelligence) はこれを重要なステップとして挙げており、この用語は技術レベルを超えたバズワードとなっています。ただし、本質的に、エージェントは新しい概念ではありません。これに AI のエンパワーメントを加えると、革命的な技術トレンドとは言えません。

1つは、OpenAIの観点からのAIエージェントであり、自動運転分類におけるL3に似ています。AIエージェントは、一定の高度な運​​転支援機能を備えていると見なされますが、完全に人間に取って代わることはできません。

画像の説明: OpenAI 計画の AGI 段階、画像出典: https://www.bloomberg.com/

第二に、AI エージェントは、名前が示すように、AI の恩恵を受けたエージェントです。OpenAI の計画の下では、エージェントは対話形式 (ChatGPT) と推論形式 (さまざまなボット) になります。 ) 最後の L3 ステージは、「特定の動作を自律的に実行する」こと、または LangChain の創設者である Harrison Chase の定義を使用することによって特徴付けられます。「AI エージェントは、LLM を使用するエージェントです。」プログラム制御フローの決定を行うためのシステム。」

これが謎なのですが、LLM が登場する前は、プログラマがクローラ プログラムを設計する際、エージェントは主に人為的に設定された自動処理を実行していました。もちろん、AI エージェントを使用して人間の動作をより詳細に模倣すると、AI エージェント クローラー フレームワークが表示され、クローラーが「より人間らしく」なります。

このような変更では、AI Agent の追加は既存のシナリオと組み合わせる必要があります。Curosr や Github copilot などのコード補完機能や生成機能も、LSP (Language Server Protocol) などに基づいています。考えてみると、これには多くの例があります。

  • Apple: AppleScript (スクリプトエディタ)--Alfred--Siri--ショートカット--Apple Intelligence
  • ターミナル: ターミナル (macOS)/Power Shell (Windows)--iTerm 2--Warp(AI ネイティブ)
  • 人間とコンピュータのインタラクション: Web 1.0 CLI TCP/IP Netscape Browser--Web 2.0 GUI/RestAPI/ Search Engine/Google/Super App--Web 3.0 AI Agent + dapp?

少し説明すると、人間とコンピュータのインタラクションのプロセスにおいて、Web 1.0 GUI とブラウザの組み合わせにより、Windows + IE の組み合わせに代表されるように、実際に公衆が何の障壁もなくコンピュータを使用できるようになります。API はデータの抽象化であり、API はデータの抽象化であり、 Web 2.0 時代のインターネットの背後にある伝送規格 ブラウザはすでに Chrome の時代を迎えており、モバイルへの移行により人々のインターネット利用習慣が変化しました。WeChat や Meta などのスーパー プラットフォームのアプリが人々の生活のあらゆる側面をカバーしています。 。

第三に、暗号分野におけるインテントの概念は、AI エージェント サークルの爆発的な前兆です。ただし、これは不完全なビットコイン スクリプトからイーサリアム スマート コントラクトまで、エージェントの概念自体が暗号内でのみ有効であることに注意してください。広く使用され、その後生み出されたクロスチェーンブリッジ - チェーン抽象化、EOA - AA ウォレットはすべてこの種の考え方の自然な拡張であるため、AI エージェントが暗号通貨に「侵入」した後、DeFi につながりました。この光景は驚くことではありません。

ここで、Crypto の文脈で AI エージェントの概念が混乱します。私たちが実際に実現したいのは、「自動的に財務を管理し、新しいミームを自動的に作成する」エージェントです。しかし、OpenAI の定義では、そのような危険なシナリオさえも必要になります。 L4 /L5 は本当に実現できますが、一般の人が遊んでいるのは自動コード生成や AI ワンクリック要約、ゴーストライティングなどの機能です。両者間のコミュニケーションは同じ次元ではありません。

私たちが本当に望んでいることは理解できたので、AI エージェントの組織ロジックに焦点を当てましょう。技術的な詳細は後で隠します。結局のところ、AI エージェントのコンセプトは、大規模な普及の障害からテクノロジーを取り除くことです。このツールはパーソナル PC 業界にミダス的な影響を与えているため、人間とコンピューターのインタラクションの観点から AI エージェントを考察することと、AI エージェントとそれをリードする LLM の違いとつながりの 2 点に焦点を当てます。第三部へ: 暗号と AI エージェント この組み合わせは最終的に何も残さない。

AI_Agent = LLM+API とします。

ChatGPT などのチャットベースの人間とコンピューターの対話モデルが登場する前は、人間とコンピューター間の対話は主に GUI (グラフィカル インターフェイス) と CLI (コマンド ライン インターフェイス) の形式で行われ、GUI の考え方はブラウザー、アプリ、その他の特定のものを導き出し続けました。フォーム、CLI とシェルの組み合わせはほとんど変更されません。

しかし、これは人間とコンピューターの「フロントエンド」の表面上のやりとりにすぎません。インターネットの発展に伴い、データの量と種類が増加することで、データ間の「バックエンド」のやりとりも増加しています。単純な Web ブラウジング動作であっても、実際には 2 つの連携と協力が必要です。

しかし、これは人間とコンピューターの「フロントエンド」の表面上のやりとりにすぎません。インターネットの発展に伴い、データの量と種類が増加することで、データ間の「バックエンド」のやりとりも増加しています。単純な Web ブラウジング動作であっても、実際には 2 つの連携と協力が必要です。

人とブラウザとアプリの間のインタラクションについて言えば、ユーザーポータルについて話しますが、実際には、これも一般のユーザーには必要のない、インターネットの実際の操作をサポートするものです。コマンドラインやAPIなどの用語を理解することで目的を達成することができます。

LLM についても同様であり、ユーザーはさらに一歩進んで、プロセス全体を次の手順のように記述することができます。

  1. ユーザーがチャット ウィンドウを開きます。
  2. ユーザーは自然言語、つまりテキストまたは音声を使用してニーズを説明します。
  3. LLM はそれを解析して合理化された操作ステップに変換します。
  4. LLM は結果をユーザーに返します。

このプロセスでは、最大の課題は Google であることがわかります。ユーザーは検索エンジンを開く必要はなく、GPT のようなさまざまなダイアログ ウィンドウを開く必要があり、トラフィックの入り口が静かに変化しているためです。この LLM は検索エンジンの生活に革命をもたらすと考えています。

では、AI エージェントはこの中でどのような役割を果たしているのでしょうか?

一言で言えば、AI Agent は LLM を専門化したものです。

現在の LLM は AGI ではありません。つまり、OpenAI の理想的な L5 オーガナイザーではありません。たとえば、ユーザーが情報を入力しすぎると幻覚を引き起こしやすいことが挙げられます。たとえば、トレーニング メカニズムで GPT 1+1=3 を繰り返し指示すると、次のインタラクションでは一定の確率で 1+1+1= が要求されます。答えが 4 である確率を示します。

現時点での GPT のフィードバックは完全に個人ユーザーからのものであるため、モデルがインターネットに接続されていない場合、今後は、ユーザーの情報によって動作メカニズムが変更される可能性があります。 1+1=3 はわかりますが、モデルがインターネットに接続できる場合、GPT のフィードバック メカニズムはより多様になります。結局のところ、インターネット上の大多数の人は 1+1=2 であると信じています。

難易度はさらに上がりますが、ローカルで LLM を使用する必要がある場合、そのような問題を回避するにはどうすればよいでしょうか?

簡単かつ大雑把な方法は、2 つの LLM を同時に使用し、質問に答えるたびに 2 つの LLM が相互に検証するように規定することです。これが機能しない場合は、エラーが発生する可能性が低くなります。他の方法としては、2 人のユーザーが一度に 1 つのプロセスを処理し、1 人が質問を担当し、もう 1 人が質問を微調整する責任を負い、言語をより標準化して合理的にすることを試みます。

もちろん、インターネットでは問題を完全に回避できない場合もあります。たとえば、LLM が知的障害のあるバーから回答を取得する場合、状況は悪化する可能性があります。ただし、これらのデータを回避すると、利用可能なデータの量が減少するため、既存のデータが分割される可能性があります。実際、これは RAG (検索拡張生成) の自然言語理解です。

人間と機械は相互に理解する必要があります。複数の LLM が相互に理解して連携できるようにすると、本質的に AI エージェントの動作モードに触れることになります。つまり、人間のエージェントが他のリソースを呼び出します。これには大規模なモデルやモデルも含まれる場合があります。他のエージェント。

このことから、LLM と AI エージェントの関係を把握しました。LLM は人間が対話ウィンドウを通じてコミュニケーションできる知識の集合体ですが、実際には、いくつかの特定のタスク フローを特定の小さなプログラム、ボット、および命令セット、これらをエージェントとして定義します。

AI エージェントは依然として LLM の一部であり、この 2 つを同じものと見なすことはできません。AI エージェントの呼び出し方法は LLM に基づいており、特に外部プログラム、LLM および他のエージェントの連携に重点が置かれているため、AI エージェント = LLM となります。 +API感。

次に、LLM ワークフローに AI エージェントの命令を追加できます。例として X の API データを呼び出してみましょう。

  1. 人間のユーザーがチャット ウィンドウを開きます。
  2. ユーザーは自然言語、つまりテキストまたは音声を使用してニーズを説明します。
  3. LLM はそれを API 呼び出しのような AI エージェント タスクに解析し、会話許可をエージェントに転送します。
  4. AI エージェントはユーザー X にアカウントと API パスワードを要求し、ユーザーの説明に基づいてオンラインで X と通信します。
  5. AI エージェントは最終結果をユーザーに返します。

人間とコンピューターの対話の進化の歴史をまだ覚えていますか? Web 1.0 と Web 2.0 に存在したブラウザーと API は今後も存在しますが、ユーザーはその存在を完全に無視して、AI エージェントの呼び出しのみを操作することができます。およびその他のプロセスは会話形式で使用でき、相手がインターフェースを開いてユーザーが許可を持っている限り、これらの API サービスはローカル データ、ネットワーク情報、外部アプリ データなど、あらゆる種類のものにすることができます。それを使うために。

完全な AI エージェントの使用プロセスは、上の図に示されています。LLM は、AI エージェントとは別の部分と見なすことも、プロセスの 2 つのサブリンクと見なすこともできます。 、ユーザーのニーズに応えます。

人間とコンピュータの対話プロセスの観点から見ると、ユーザーが自分自身と会話している場合でも、ユーザーは自分の考えや考えを表現するだけでよく、AI/LLM/AI エージェントがユーザーのニーズを何度も推測します。フィードバック メカニズムを追加し、LLM に現在の状況のコンテキスト (Context) を記憶するよう要求することで、AI エージェントが自分が行っていることを突然忘れないようにすることができます。

つまり、AI エージェントは、従来のスクリプトや自動化ツールとの本質的な違いであり、ユーザーの真のニーズを考慮する必要があります。推測の結果、L3 レベルの AI エージェントには人間の理解力や表現力が備わっていないため、外部 API に接続することは危険に満ちています。

AIフレームワークを収益化した後

AI フレームワークが収益化できるという事実は、私が Crypto に興味を持ち続ける重要な理由です。従来の AI テクノロジー スタックでは、フレームワークはそれほど重要ではなく、少なくともデータやコンピューティング能力ほど重要ではありません。 AI 製品をフレームワークから収益化するのは困難です。結局のところ、ほとんどの AI アルゴリズムとモデル フレームワークはオープンソース製品であり、データなどの機密情報です。

本質的に、AI フレームワークまたはモデルは一連のアルゴリズムの容器と組み合わせであり、ガチョウを煮る鉄鍋に相当します。ただし、ガチョウの種類と火加減が味を区別する鍵となります。販売されている製品は本質的に異なります。それは大きなガチョウであるはずですが、現在、Web3 の顧客は真珠の箱を購入したいのに、ポットを購入してガチョウを放棄しています。

その理由は複雑ではありません。Web3 の AI 製品は基本的に、既存の AI フレームワーク、アルゴリズム、製品に基づいてカスタマイズされた製品であるため、技術的には大きな違いはありません。見分けがつかないため、名前やアプリケーションシナリオなどについて大騒ぎする必要があります。そのため、AI フレームワーク自体にいくつかの小さな調整を加えた結果、さまざまなトークンがサポートされるようになり、Crypto AI Agent のフレームワークバブルが発生しました。

学習データやアルゴリズムに多額の投資をする必要がないため、DeepSeek V3 がどれほど安価であっても、多くのドクターズ ヘアと GPU と電力消費が必要になります。

これはある意味、トークンよりもトークン発行プラットフォームの価値が高いという最近のWeb3の一貫したスタイルでもあり、Pump.Fun/Hyperliquidも同様で、エージェントは本来アプリケーションやアセットであるべきなのですが、代理発行フレームワークは最も人気のある製品になっています。

実際、これはさまざまなタイプのエージェント間の区別がないため、エージェントのフレームワークはより安定しており、資産発行の価値の吸い上げ効果を生み出すことができます。これは、Crypto の組み合わせの現在の 1.0 バージョンです。そしてAIエージェント。

2.0 バージョンが登場しており、通常は DeFi と AI エージェントの組み合わせです。DeFAI の概念はもちろん熱によって刺激された市場の動きですが、次の状況を考慮すると、それが異なることがわかります。

2.0 バージョンが登場しており、通常は DeFi と AI エージェントの組み合わせです。DeFAI の概念はもちろん熱によって刺激された市場の動きですが、次の状況を考慮すると、それが異なることがわかります。

  • Morpho は、Aave などの古い融資商品に挑戦しています。
  • HyperliquidはdYdXのオンチェーンデリバティブを置き換え、さらにはBinanceのCEXリスト効果に挑戦しています。
  • ステーブルコインはオフチェーンシナリオの支払いツールになりつつあります。

DeFiの進化の背景には、AIがDeFiの基本ロジックを改良していることがあり、これまでのDeFiの最大のロジックがスマートコントラクトの実現可能性を検証することであったとしたら、AIエージェントはDeFiの製造ロジックを変更する必要はありません。 DeFi を理解する この方法でのみ DeFi 製品を作成できます。これは、チェーンの抽象化よりもさらに基礎的な権限を与えます。

誰もがプログラマーとなり、複雑な計算を AI エージェントの背後にある LLM と API にアウトソーシングし、個人が自分のアイデアに集中するだけで、自然言語を効率的にプログラミング ロジックに変換できる時代が到来します。

結論

この記事では、Crypto AI Agent のトークンとフレームワークについては触れていません。なぜなら、Cookie.Fun は AI エージェント情報の集約とトークン検出プラットフォーム、次に AI エージェント フレームワーク、そして最後にエージェント生成という十分な仕事をしてきたからです。コインが突然現れたり消えたりするため、記事に情報を記載し続けることに価値はありません。

ただし、この観察期間中、Crypto AI Agent が市場で何を指すのかについてはまだ本格的な議論が不足しています。メモリの変更が本質であると常に議論できるわけではありません。

さまざまな原資産を継続的に資産に変換できることこそが、クリプトの魅力です。

コメント

全てのコメント

Recommended for you

  • EXORグループ:テザーによるユベントス株買収提案を拒否

    EXORグループ:テザーによるユヴェントス株買収の申し出を拒否し、売却しない意向を改めて表明した。以前、仮想通貨大手テザーはユヴェントス買収に真剣に取り組んでおり、20億ユーロを超える新たな買収提案を行う用意があると報じられていた。

  • テザーは総額20億ユーロを超える評価額でユベントスを買収する新たな提案を行った。

    仮想通貨大手テザーは、ユヴェントス・フットボールクラブの買収計画を真剣に検討しており、20億ユーロを超える新たな買収提案を準備している。昨日、テザーはエクソールの取締役会に対し、アニェッリ家が保有するユヴェントスの株式65.4%の買収提案を提出した。このニュースはCEOのパウロ・アルドイーノ氏によってソーシャルメディアで発表されたが、これは交渉の始まりに過ぎない。

  • 米国のスポットイーサリアムETFは昨日、1,940万ドルの純流出を記録した。

    TraderTのモニタリングによると、米国のスポットイーサリアムETFは昨日1,940万ドルの純流出を記録した。

  • 中国資産管理(香港)が、Solana 上でアジア最大のトークン化マネーマーケットファンドを立ち上げました。

    12月12日、ChinaAMC HKの製品・戦略責任者であるKatie He氏は、Solana Breakpointカンファレンスにおいて、香港ドル(HKD)、米ドル(USD)、中国元(RMB)建てのアジア初にして最大規模のトークン化マネーマーケットファンドを立ち上げることを発表しました。このファンドは、従来のマネーマーケット商品をトークン化し、投資家に安定したリターン、完全な透明性、そしてリアルタイム決済への安全なオンチェーンアクセスを提供します。規制当局やOSLなどのパートナーとの数か月にわたる協力を経て、このイノベーションは香港からより広い地域へと拡大し、Solanaブロックチェーン上にネイティブに展開される予定です。

  • カナダロイヤル銀行はアメリカのビットコイン株77,700株を購入した。

    市場筋によると、時価総額1兆ドルのカナダロイヤル銀行は、アメリカン・ビットコイン($ABTC)を77,700株、約15万ドル相当購入した。このビットコインマイニング企業は、トランプ一族のエリック・トランプ氏が支援している。

  • 中国人民銀行:適度に緩和的な金融政策を継続し、人民元の国際化を推進する。

    中国人民銀行党委員会は会議を開催した。議事録第3項には、「適度に緩和的な金融政策を引き続き実施し、金融供給サイドの構造改革を加速する。安定した経済成長と物価の適切な回復を促進することは、金融政策における重要な考慮事項となる。預金準備率の引き下げや金利の引き下げといった各種金融政策手段を柔軟かつ効率的に活用する。政策実施の強度、速度、タイミングを慎重に管理し、潤沢な流動性を維持し、社会融資コスト全体の低下を促進し、実体経済への金融支援を強化する。金融政策の波及メカニズムを円滑化し、構造的な金融政策手段の活用を最適化し、財政政策との連携を強化することで、金融機関が内需拡大、技術革新、中小企業といった重点分野への支援を強化するよう促し、指導する。人民元為替レートの合理的かつ均衡のとれた水準における基本的安定を維持する」と記されている。会議議事録の第5項には、「ハイレベルの金融開放を着実に推進し、中国の国家金融安全保障を守る。グローバルガバナンスの取り組みを実施し、グローバル金融ガバナンスの改革・改善に積極的に参加・推進する。実務的な金融外交と多国間・二国間の通貨金融協力を展開する。人民元の国際化を推進する。マルチチャネル・広域カバーの人民元クロスボーダー決済システムの構築・発展を継続する。デジタル人民元を着実に発展させる」と記されている。

  • 日本銀行はさらなる利上げを計画していると報じられており、一部の当局者は中立金利は1%を超えると考えている。

    関係筋によると、日本銀行(BOJ)当局者は、現在の利上げサイクルが終了する前に金利が0.75%を超える可能性が高いと見ており、来週の利上げ後もさらなる利上げが行われる可能性を示唆している。関係者によると、当局者は0.75%でも日銀は中立金利水準に達していないと考えているという。一部の当局者はすでに1%が中立金利を下回ると考えている。関係筋によると、日銀が最新のデータに基づいて中立金利の推計値を更新したとしても、現時点では金利レンジが大幅に縮小するとは予想していないという。日銀は現在、名目中立金利レンジを約1%から2.5%と推定している。また、関係者によると、日銀当局者は、このレンジの上限と下限自体に誤差が含まれている可能性があると考えているという。(Jinshi)

  • Nexus は「Node Light・Pioneer Wealth Management Week」を開始し、Node ユーザー専用のチャンネルを作成しました。

    12月12日、Nexusは5日間にわたる「Node Lightパイオニア資産管理ウィーク」の開催を発表しました。このウィークは「Node Identity Financial Privileges(ノード・アイデンティティ金融特権)」という中核コンセプトを軸に、コアエコシステム参加者にプラットフォームの他のユーザーとは独立した特別な資産管理サイクルを提供します。このイベントは、特別な資産管理パッケージへの加入を希望するノードユーザー専用であり、プラットフォーム全体の資産管理とNexSwapの今後のローンチに向けた市場の期待を高めるものです。

  • 米SEC委員長:DTC参加者はトークン化された証券を他の参加者の登録ウォレットに転送できる。

    米国証券取引委員会(SEC)のポール・アトキンス委員長は、Xプラットフォームに掲載された記事の中で、米国金融市場はオンチェーンへの移行を間近に控えており、イノベーションを優先し、新技術を積極的に導入していくと述べました。SECは米国預託信託決済機構(DTC)に対し、いかなる措置も取らない旨の書簡を送付しました。オンチェーン市場は、投資家に高い予測可能性、透明性、そして効率性をもたらします。DTC参加者は、トークン化された証券を他の参加者の登録ウォレットに直接送金できるようになり、これらの取引はDTCによって記録・追跡されます。

  • テザーは株式公開を通じて最大200億ドルを調達する計画だ。

    ブルームバーグによると、テザー社は株式公開を通じて最大200億ドルの資金調達を計画しており、売却完了後に株式のトークン化を検討するとのことです。事情に詳しい情報筋によると、テザー社の幹部は自社株買いや、取引完了後に自社株をブロックチェーン上にデジタル形式で保管するなど、様々な選択肢を検討しているとのことです。