Cointime

Download App
iOS & Android

AI は暗号通貨のエージェントです: AI エージェントの進化

Cointime Official

作者: ズオ・イエ

芸術作品は決して完成することはなく、放棄されるだけです。

誰もが AI エージェントについて話していますが、話している内容は同じではありません。これは、私たちが関心を持っている AI エージェントと一般の視点、および AI 実践者の視点との違いにつながります。

ずっと前に、私は「暗号は AI の幻想である」と書きましたが、当時から現在に至るまで、暗号と AI の組み合わせは報われない愛であり、AI の専門家が Web3/ブロックチェーンという用語を言及することはめったにありません。しかし、私は AI に情熱を持っており、AI エージェント フレームワークがトークン化できるという驚異を知った後、それが本当に AI 実践者を私たちの世界に導入できるかどうかはわかりません。

AI はクリプトの代理人である これは、今回の AI の急増をクリプトの観点から見るための最良の説明です。特に、クリプトの AI に対する熱意は、金融資産の発行と運用を統合することを望んでいます。

エージェントの進化、原点はテクニカルマーケティング

そのルーツを調査すると、AI エージェントには少なくとも 3 つのソースがあり、OpenAI の AGI (General Artificial Intelligence) はこれを重要なステップとして挙げており、この用語は技術レベルを超えたバズワードとなっています。ただし、本質的に、エージェントは新しい概念ではありません。これに AI のエンパワーメントを加えると、革命的な技術トレンドとは言えません。

1つは、OpenAIの観点からのAIエージェントであり、自動運転分類におけるL3に似ています。AIエージェントは、一定の高度な運​​転支援機能を備えていると見なされますが、完全に人間に取って代わることはできません。

画像の説明: OpenAI 計画の AGI 段階、画像出典: https://www.bloomberg.com/

第二に、AI エージェントは、名前が示すように、AI の恩恵を受けたエージェントです。OpenAI の計画の下では、エージェントは対話形式 (ChatGPT) と推論形式 (さまざまなボット) になります。 ) 最後の L3 ステージは、「特定の動作を自律的に実行する」こと、または LangChain の創設者である Harrison Chase の定義を使用することによって特徴付けられます。「AI エージェントは、LLM を使用するエージェントです。」プログラム制御フローの決定を行うためのシステム。」

これが謎なのですが、LLM が登場する前は、プログラマがクローラ プログラムを設計する際、エージェントは主に人為的に設定された自動処理を実行していました。もちろん、AI エージェントを使用して人間の動作をより詳細に模倣すると、AI エージェント クローラー フレームワークが表示され、クローラーが「より人間らしく」なります。

このような変更では、AI Agent の追加は既存のシナリオと組み合わせる必要があります。Curosr や Github copilot などのコード補完機能や生成機能も、LSP (Language Server Protocol) などに基づいています。考えてみると、これには多くの例があります。

  • Apple: AppleScript (スクリプトエディタ)--Alfred--Siri--ショートカット--Apple Intelligence
  • ターミナル: ターミナル (macOS)/Power Shell (Windows)--iTerm 2--Warp(AI ネイティブ)
  • 人間とコンピュータのインタラクション: Web 1.0 CLI TCP/IP Netscape Browser--Web 2.0 GUI/RestAPI/ Search Engine/Google/Super App--Web 3.0 AI Agent + dapp?

少し説明すると、人間とコンピュータのインタラクションのプロセスにおいて、Web 1.0 GUI とブラウザの組み合わせにより、Windows + IE の組み合わせに代表されるように、実際に公衆が何の障壁もなくコンピュータを使用できるようになります。API はデータの抽象化であり、API はデータの抽象化であり、 Web 2.0 時代のインターネットの背後にある伝送規格 ブラウザはすでに Chrome の時代を迎えており、モバイルへの移行により人々のインターネット利用習慣が変化しました。WeChat や Meta などのスーパー プラットフォームのアプリが人々の生活のあらゆる側面をカバーしています。 。

第三に、暗号分野におけるインテントの概念は、AI エージェント サークルの爆発的な前兆です。ただし、これは不完全なビットコイン スクリプトからイーサリアム スマート コントラクトまで、エージェントの概念自体が暗号内でのみ有効であることに注意してください。広く使用され、その後生み出されたクロスチェーンブリッジ - チェーン抽象化、EOA - AA ウォレットはすべてこの種の考え方の自然な拡張であるため、AI エージェントが暗号通貨に「侵入」した後、DeFi につながりました。この光景は驚くことではありません。

ここで、Crypto の文脈で AI エージェントの概念が混乱します。私たちが実際に実現したいのは、「自動的に財務を管理し、新しいミームを自動的に作成する」エージェントです。しかし、OpenAI の定義では、そのような危険なシナリオさえも必要になります。 L4 /L5 は本当に実現できますが、一般の人が遊んでいるのは自動コード生成や AI ワンクリック要約、ゴーストライティングなどの機能です。両者間のコミュニケーションは同じ次元ではありません。

私たちが本当に望んでいることは理解できたので、AI エージェントの組織ロジックに焦点を当てましょう。技術的な詳細は後で隠します。結局のところ、AI エージェントのコンセプトは、大規模な普及の障害からテクノロジーを取り除くことです。このツールはパーソナル PC 業界にミダス的な影響を与えているため、人間とコンピューターのインタラクションの観点から AI エージェントを考察することと、AI エージェントとそれをリードする LLM の違いとつながりの 2 点に焦点を当てます。第三部へ: 暗号と AI エージェント この組み合わせは最終的に何も残さない。

AI_Agent = LLM+API とします。

ChatGPT などのチャットベースの人間とコンピューターの対話モデルが登場する前は、人間とコンピューター間の対話は主に GUI (グラフィカル インターフェイス) と CLI (コマンド ライン インターフェイス) の形式で行われ、GUI の考え方はブラウザー、アプリ、その他の特定のものを導き出し続けました。フォーム、CLI とシェルの組み合わせはほとんど変更されません。

しかし、これは人間とコンピューターの「フロントエンド」の表面上のやりとりにすぎません。インターネットの発展に伴い、データの量と種類が増加することで、データ間の「バックエンド」のやりとりも増加しています。単純な Web ブラウジング動作であっても、実際には 2 つの連携と協力が必要です。

しかし、これは人間とコンピューターの「フロントエンド」の表面上のやりとりにすぎません。インターネットの発展に伴い、データの量と種類が増加することで、データ間の「バックエンド」のやりとりも増加しています。単純な Web ブラウジング動作であっても、実際には 2 つの連携と協力が必要です。

人とブラウザとアプリの間のインタラクションについて言えば、ユーザーポータルについて話しますが、実際には、これも一般のユーザーには必要のない、インターネットの実際の操作をサポートするものです。コマンドラインやAPIなどの用語を理解することで目的を達成することができます。

LLM についても同様であり、ユーザーはさらに一歩進んで、プロセス全体を次の手順のように記述することができます。

  1. ユーザーがチャット ウィンドウを開きます。
  2. ユーザーは自然言語、つまりテキストまたは音声を使用してニーズを説明します。
  3. LLM はそれを解析して合理化された操作ステップに変換します。
  4. LLM は結果をユーザーに返します。

このプロセスでは、最大の課題は Google であることがわかります。ユーザーは検索エンジンを開く必要はなく、GPT のようなさまざまなダイアログ ウィンドウを開く必要があり、トラフィックの入り口が静かに変化しているためです。この LLM は検索エンジンの生活に革命をもたらすと考えています。

では、AI エージェントはこの中でどのような役割を果たしているのでしょうか?

一言で言えば、AI Agent は LLM を専門化したものです。

現在の LLM は AGI ではありません。つまり、OpenAI の理想的な L5 オーガナイザーではありません。たとえば、ユーザーが情報を入力しすぎると幻覚を引き起こしやすいことが挙げられます。たとえば、トレーニング メカニズムで GPT 1+1=3 を繰り返し指示すると、次のインタラクションでは一定の確率で 1+1+1= が要求されます。答えが 4 である確率を示します。

現時点での GPT のフィードバックは完全に個人ユーザーからのものであるため、モデルがインターネットに接続されていない場合、今後は、ユーザーの情報によって動作メカニズムが変更される可能性があります。 1+1=3 はわかりますが、モデルがインターネットに接続できる場合、GPT のフィードバック メカニズムはより多様になります。結局のところ、インターネット上の大多数の人は 1+1=2 であると信じています。

難易度はさらに上がりますが、ローカルで LLM を使用する必要がある場合、そのような問題を回避するにはどうすればよいでしょうか?

簡単かつ大雑把な方法は、2 つの LLM を同時に使用し、質問に答えるたびに 2 つの LLM が相互に検証するように規定することです。これが機能しない場合は、エラーが発生する可能性が低くなります。他の方法としては、2 人のユーザーが一度に 1 つのプロセスを処理し、1 人が質問を担当し、もう 1 人が質問を微調整する責任を負い、言語をより標準化して合理的にすることを試みます。

もちろん、インターネットでは問題を完全に回避できない場合もあります。たとえば、LLM が知的障害のあるバーから回答を取得する場合、状況は悪化する可能性があります。ただし、これらのデータを回避すると、利用可能なデータの量が減少するため、既存のデータが分割される可能性があります。実際、これは RAG (検索拡張生成) の自然言語理解です。

人間と機械は相互に理解する必要があります。複数の LLM が相互に理解して連携できるようにすると、本質的に AI エージェントの動作モードに触れることになります。つまり、人間のエージェントが他のリソースを呼び出します。これには大規模なモデルやモデルも含まれる場合があります。他のエージェント。

このことから、LLM と AI エージェントの関係を把握しました。LLM は人間が対話ウィンドウを通じてコミュニケーションできる知識の集合体ですが、実際には、いくつかの特定のタスク フローを特定の小さなプログラム、ボット、および命令セット、これらをエージェントとして定義します。

AI エージェントは依然として LLM の一部であり、この 2 つを同じものと見なすことはできません。AI エージェントの呼び出し方法は LLM に基づいており、特に外部プログラム、LLM および他のエージェントの連携に重点が置かれているため、AI エージェント = LLM となります。 +API感。

次に、LLM ワークフローに AI エージェントの命令を追加できます。例として X の API データを呼び出してみましょう。

  1. 人間のユーザーがチャット ウィンドウを開きます。
  2. ユーザーは自然言語、つまりテキストまたは音声を使用してニーズを説明します。
  3. LLM はそれを API 呼び出しのような AI エージェント タスクに解析し、会話許可をエージェントに転送します。
  4. AI エージェントはユーザー X にアカウントと API パスワードを要求し、ユーザーの説明に基づいてオンラインで X と通信します。
  5. AI エージェントは最終結果をユーザーに返します。

人間とコンピューターの対話の進化の歴史をまだ覚えていますか? Web 1.0 と Web 2.0 に存在したブラウザーと API は今後も存在しますが、ユーザーはその存在を完全に無視して、AI エージェントの呼び出しのみを操作することができます。およびその他のプロセスは会話形式で使用でき、相手がインターフェースを開いてユーザーが許可を持っている限り、これらの API サービスはローカル データ、ネットワーク情報、外部アプリ データなど、あらゆる種類のものにすることができます。それを使うために。

完全な AI エージェントの使用プロセスは、上の図に示されています。LLM は、AI エージェントとは別の部分と見なすことも、プロセスの 2 つのサブリンクと見なすこともできます。 、ユーザーのニーズに応えます。

人間とコンピュータの対話プロセスの観点から見ると、ユーザーが自分自身と会話している場合でも、ユーザーは自分の考えや考えを表現するだけでよく、AI/LLM/AI エージェントがユーザーのニーズを何度も推測します。フィードバック メカニズムを追加し、LLM に現在の状況のコンテキスト (Context) を記憶するよう要求することで、AI エージェントが自分が行っていることを突然忘れないようにすることができます。

つまり、AI エージェントは、従来のスクリプトや自動化ツールとの本質的な違いであり、ユーザーの真のニーズを考慮する必要があります。推測の結果、L3 レベルの AI エージェントには人間の理解力や表現力が備わっていないため、外部 API に接続することは危険に満ちています。

AIフレームワークを収益化した後

AI フレームワークが収益化できるという事実は、私が Crypto に興味を持ち続ける重要な理由です。従来の AI テクノロジー スタックでは、フレームワークはそれほど重要ではなく、少なくともデータやコンピューティング能力ほど重要ではありません。 AI 製品をフレームワークから収益化するのは困難です。結局のところ、ほとんどの AI アルゴリズムとモデル フレームワークはオープンソース製品であり、データなどの機密情報です。

本質的に、AI フレームワークまたはモデルは一連のアルゴリズムの容器と組み合わせであり、ガチョウを煮る鉄鍋に相当します。ただし、ガチョウの種類と火加減が味を区別する鍵となります。販売されている製品は本質的に異なります。それは大きなガチョウであるはずですが、現在、Web3 の顧客は真珠の箱を購入したいのに、ポットを購入してガチョウを放棄しています。

その理由は複雑ではありません。Web3 の AI 製品は基本的に、既存の AI フレームワーク、アルゴリズム、製品に基づいてカスタマイズされた製品であるため、技術的には大きな違いはありません。見分けがつかないため、名前やアプリケーションシナリオなどについて大騒ぎする必要があります。そのため、AI フレームワーク自体にいくつかの小さな調整を加えた結果、さまざまなトークンがサポートされるようになり、Crypto AI Agent のフレームワークバブルが発生しました。

学習データやアルゴリズムに多額の投資をする必要がないため、DeepSeek V3 がどれほど安価であっても、多くのドクターズ ヘアと GPU と電力消費が必要になります。

これはある意味、トークンよりもトークン発行プラットフォームの価値が高いという最近のWeb3の一貫したスタイルでもあり、Pump.Fun/Hyperliquidも同様で、エージェントは本来アプリケーションやアセットであるべきなのですが、代理発行フレームワークは最も人気のある製品になっています。

実際、これはさまざまなタイプのエージェント間の区別がないため、エージェントのフレームワークはより安定しており、資産発行の価値の吸い上げ効果を生み出すことができます。これは、Crypto の組み合わせの現在の 1.0 バージョンです。そしてAIエージェント。

2.0 バージョンが登場しており、通常は DeFi と AI エージェントの組み合わせです。DeFAI の概念はもちろん熱によって刺激された市場の動きですが、次の状況を考慮すると、それが異なることがわかります。

2.0 バージョンが登場しており、通常は DeFi と AI エージェントの組み合わせです。DeFAI の概念はもちろん熱によって刺激された市場の動きですが、次の状況を考慮すると、それが異なることがわかります。

  • Morpho は、Aave などの古い融資商品に挑戦しています。
  • HyperliquidはdYdXのオンチェーンデリバティブを置き換え、さらにはBinanceのCEXリスト効果に挑戦しています。
  • ステーブルコインはオフチェーンシナリオの支払いツールになりつつあります。

DeFiの進化の背景には、AIがDeFiの基本ロジックを改良していることがあり、これまでのDeFiの最大のロジックがスマートコントラクトの実現可能性を検証することであったとしたら、AIエージェントはDeFiの製造ロジックを変更する必要はありません。 DeFi を理解する この方法でのみ DeFi 製品を作成できます。これは、チェーンの抽象化よりもさらに基礎的な権限を与えます。

誰もがプログラマーとなり、複雑な計算を AI エージェントの背後にある LLM と API にアウトソーシングし、個人が自分のアイデアに集中するだけで、自然言語を効率的にプログラミング ロジックに変換できる時代が到来します。

結論

この記事では、Crypto AI Agent のトークンとフレームワークについては触れていません。なぜなら、Cookie.Fun は AI エージェント情報の集約とトークン検出プラットフォーム、次に AI エージェント フレームワーク、そして最後にエージェント生成という十分な仕事をしてきたからです。コインが突然現れたり消えたりするため、記事に情報を記載し続けることに価値はありません。

ただし、この観察期間中、Crypto AI Agent が市場で何を指すのかについてはまだ本格的な議論が不足しています。メモリの変更が本質であると常に議論できるわけではありません。

さまざまな原資産を継続的に資産に変換できることこそが、クリプトの魅力です。

コメント

全てのコメント

Recommended for you

  • BTCが87,000ドルを下回る

    市場データによると、BTCは87,000ドルを下回り、現在86,988.27ドルで取引されています。24時間の値上がり率は0.67%に縮小しました。市場のボラティリティは高いため、リスク管理にご注意ください。

  • ETHが3,000ドルを突破

    市場データによると、ETHは3,000ドルを突破し、現在3,002.51ドルで取引されており、24時間で2.19%上昇しています。市場は大きなボラティリティを経験していますので、リスク管理にご注意ください。

  • BTCが89,000ドルを突破

    市場データによると、BTCは89,000ドルを突破し、現在89,017.66ドルで取引されており、24時間で1.03%上昇しています。市場は大きなボラティリティを経験しているため、リスク管理にはご注意ください。

  • BTCが88,500ドルを突破

    市場データによると、BTCは88,500ドルを突破し、現在88,549.08ドルで取引されており、24時間で0.69%上昇しています。市場のボラティリティは高いため、リスク管理にご注意ください。

  • ナスダック上場のMangoceuticalsは、1億ドル相当のSOLデジタル資産の金庫を立ち上げる計画だ。

    ナスダック上場のマンゴーシューティカルズは、1億ドル規模のSOLデジタル資産トレジャリー(DAT)構築戦略を推進するため、Cube Groupとの提携により子会社Mango DATを設立すると発表しました。資金調達は、ATM資金調達プログラムと普通株式の発行を通じて行われます。また、同社は一連の戦略的なデジタル資産およびDeFiイニシアチブを推進するため、「MULTI-DAT」の商標を米国特許商標庁に出願したと報じられています。

  • ブラックロックは、1億840万ドル相当の36,579 ETHをCoinbase Primeアドレスに預け入れた。

    OnchainLensのモニタリングによると、BlackRockはCoinbase Primeアドレスに36,579 ETH(1億840万ドル相当)を入金した。

  • ウォーラー氏は「連邦準備制度理事会議長としてトランプ氏と非常に強いインタビューを行った」。

    CNBCによると、ウォーラー連邦準備制度理事会(FRB)理事は、次期FRB議長のポストを巡り、トランプ大統領と「力強い面談」を行ったという。ブラックロックの最高投資責任者(CIO)リック・リーダー氏は、今年最後の週にマール・アー・ラーゴで同職の面接を受ける予定だ。

  • Douyin: ブロックチェーン、デジタル資産、またはその他の類似の概念を装った違法な金融コンテンツの投稿を禁止します。

    証券時報によると、Douyinは「Douyinコミュニティ金融業界会議(試行)」を発表し、「ブロックチェーンやデジタル資産などの概念を利用して、仮想通貨交換業に関する違法な金融コンテンツをパッケージ化して公開したり、仮想通貨取引の情報仲介や価格設定サービスを提供したりすることを禁止する。また、大衆科学の名を借りて個別株の売買価格を分析・予測したり、将来の動向を宣伝したり、投資コンサルティングアドバイスを提供したり、その他の違法な株式推奨行為を行うことを禁止する」と規定している。

  • Aveai Global が統合を完了し、NXR のクロスチェーン取引機能がさらに強化されました。

    オンチェーン取引のグローバルリーディングプラットフォームであるAveai Globalは、Nexus Chainとの完全統合を正式に完了しました。この統合により、ユーザーはAveaiの統合取引ダッシュボードからNXRおよびNexus Chainエコシステム内の様々な分散型アプリケーション(dApps)に直接アクセスできるようになり、よりスマートで迅速なクロスチェーン取引と資産連携が可能になります。

  • Coinbaseの隠された青写真の長所と短所を分析する

    Coinbaseは、「ユニバーサル取引所」戦略を通じて株式、AI決済、ソーシャルファイナンスを単一のプラットフォームに統合し、暗号通貨取引所から世界的な金融インフラの中核層への変革を目指している。