AI は暗号通貨のエージェントです: AI エージェントの進化

作者: ズオ・イエ

芸術作品は決して完成することはなく、放棄されるだけです。

誰もが AI エージェントについて話していますが、話している内容は同じではありません。これは、私たちが関心を持っている AI エージェントと一般の視点、および AI 実践者の視点との違いにつながります。

ずっと前に、私は「暗号は AI の幻想である」と書きましたが、当時から現在に至るまで、暗号と AI の組み合わせは報われない愛であり、AI の専門家が Web3/ブロックチェーンという用語を言及することはめったにありません。しかし、私は AI に情熱を持っており、AI エージェントフレームワークがトークン化できるという驚異を知った後、それが本当に AI 実践者を私たちの世界に導入できるかどうかはわかりません。

AI はクリプトの代理人であるこれは、今回の AI の急増をクリプトの観点から見るための最良の説明です。特に、クリプトの AI に対する熱意は、金融資産の発行と運用を統合することを望んでいます。

エージェントの進化、原点はテクニカルマーケティング

そのルーツを調査すると、AI エージェントには少なくとも 3 つのソースがあり、OpenAI の AGI (General Artificial Intelligence) はこれを重要なステップとして挙げており、この用語は技術レベルを超えたバズワードとなっています。ただし、本質的に、エージェントは新しい概念ではありません。これに AI のエンパワーメントを加えると、革命的な技術トレンドとは言えません。

1つは、OpenAIの観点からのAIエージェントであり、自動運転分類におけるL3に似ています。AIエージェントは、一定の高度な運転支援機能を備えていると見なされますが、完全に人間に取って代わることはできません。

画像の説明: OpenAI 計画の AGI 段階、画像出典: https://www.bloomberg.com/

第二に、AI エージェントは、名前が示すように、AI の恩恵を受けたエージェントです。OpenAI の計画の下では、エージェントは対話形式 (ChatGPT) と推論形式 (さまざまなボット) になります。 ) 最後の L3 ステージは、「特定の動作を自律的に実行する」こと、または LangChain の創設者である Harrison Chase の定義を使用することによって特徴付けられます。「AI エージェントは、LLM を使用するエージェントです。」プログラム制御フローの決定を行うためのシステム。」

これが謎なのですが、LLM が登場する前は、プログラマがクローラプログラムを設計する際、エージェントは主に人為的に設定された自動処理を実行していました。もちろん、AI エージェントを使用して人間の動作をより詳細に模倣すると、AI エージェントクローラーフレームワークが表示され、クローラーが「より人間らしく」なります。

このような変更では、AI Agent の追加は既存のシナリオと組み合わせる必要があります。Curosr や Github copilot などのコード補完機能や生成機能も、LSP (Language Server Protocol) などに基づいています。考えてみると、これには多くの例があります。

Apple: AppleScript (スクリプトエディタ)--Alfred--Siri--ショートカット--Apple Intelligence
ターミナル: ターミナル (macOS)/Power Shell (Windows)--iTerm 2--Warp(AI ネイティブ)
人間とコンピュータのインタラクション: Web 1.0 CLI TCP/IP Netscape Browser--Web 2.0 GUI/RestAPI/ Search Engine/Google/Super App--Web 3.0 AI Agent + dapp?

少し説明すると、人間とコンピュータのインタラクションのプロセスにおいて、Web 1.0 GUI とブラウザの組み合わせにより、Windows + IE の組み合わせに代表されるように、実際に公衆が何の障壁もなくコンピュータを使用できるようになります。API はデータの抽象化であり、API はデータの抽象化であり、 Web 2.0 時代のインターネットの背後にある伝送規格ブラウザはすでに Chrome の時代を迎えており、モバイルへの移行により人々のインターネット利用習慣が変化しました。WeChat や Meta などのスーパープラットフォームのアプリが人々の生活のあらゆる側面をカバーしています。。

第三に、暗号分野におけるインテントの概念は、AI エージェントサークルの爆発的な前兆です。ただし、これは不完全なビットコインスクリプトからイーサリアムスマートコントラクトまで、エージェントの概念自体が暗号内でのみ有効であることに注意してください。広く使用され、その後生み出されたクロスチェーンブリッジ - チェーン抽象化、EOA - AA ウォレットはすべてこの種の考え方の自然な拡張であるため、AI エージェントが暗号通貨に「侵入」した後、DeFi につながりました。この光景は驚くことではありません。

ここで、Crypto の文脈で AI エージェントの概念が混乱します。私たちが実際に実現したいのは、「自動的に財務を管理し、新しいミームを自動的に作成する」エージェントです。しかし、OpenAI の定義では、そのような危険なシナリオさえも必要になります。 L4 /L5 は本当に実現できますが、一般の人が遊んでいるのは自動コード生成や AI ワンクリック要約、ゴーストライティングなどの機能です。両者間のコミュニケーションは同じ次元ではありません。

私たちが本当に望んでいることは理解できたので、AI エージェントの組織ロジックに焦点を当てましょう。技術的な詳細は後で隠します。結局のところ、AI エージェントのコンセプトは、大規模な普及の障害からテクノロジーを取り除くことです。このツールはパーソナル PC 業界にミダス的な影響を与えているため、人間とコンピューターのインタラクションの観点から AI エージェントを考察することと、AI エージェントとそれをリードする LLM の違いとつながりの 2 点に焦点を当てます。第三部へ: 暗号と AI エージェントこの組み合わせは最終的に何も残さない。

AI_Agent = LLM+API とします。

ChatGPT などのチャットベースの人間とコンピューターの対話モデルが登場する前は、人間とコンピューター間の対話は主に GUI (グラフィカルインターフェイス) と CLI (コマンドラインインターフェイス) の形式で行われ、GUI の考え方はブラウザー、アプリ、その他の特定のものを導き出し続けました。フォーム、CLI とシェルの組み合わせはほとんど変更されません。

しかし、これは人間とコンピューターの「フロントエンド」の表面上のやりとりにすぎません。インターネットの発展に伴い、データの量と種類が増加することで、データ間の「バックエンド」のやりとりも増加しています。単純な Web ブラウジング動作であっても、実際には 2 つの連携と協力が必要です。

人とブラウザとアプリの間のインタラクションについて言えば、ユーザーポータルについて話しますが、実際には、これも一般のユーザーには必要のない、インターネットの実際の操作をサポートするものです。コマンドラインやAPIなどの用語を理解することで目的を達成することができます。

LLM についても同様であり、ユーザーはさらに一歩進んで、プロセス全体を次の手順のように記述することができます。

ユーザーがチャットウィンドウを開きます。
ユーザーは自然言語、つまりテキストまたは音声を使用してニーズを説明します。
LLM はそれを解析して合理化された操作ステップに変換します。
LLM は結果をユーザーに返します。

このプロセスでは、最大の課題は Google であることがわかります。ユーザーは検索エンジンを開く必要はなく、GPT のようなさまざまなダイアログウィンドウを開く必要があり、トラフィックの入り口が静かに変化しているためです。この LLM は検索エンジンの生活に革命をもたらすと考えています。

では、AI エージェントはこの中でどのような役割を果たしているのでしょうか?

一言で言えば、AI Agent は LLM を専門化したものです。

現在の LLM は AGI ではありません。つまり、OpenAI の理想的な L5 オーガナイザーではありません。たとえば、ユーザーが情報を入力しすぎると幻覚を引き起こしやすいことが挙げられます。たとえば、トレーニングメカニズムで GPT 1+1=3 を繰り返し指示すると、次のインタラクションでは一定の確率で 1+1+1= が要求されます。答えが 4 である確率を示します。

現時点での GPT のフィードバックは完全に個人ユーザーからのものであるため、モデルがインターネットに接続されていない場合、今後は、ユーザーの情報によって動作メカニズムが変更される可能性があります。 1+1=3 はわかりますが、モデルがインターネットに接続できる場合、GPT のフィードバックメカニズムはより多様になります。結局のところ、インターネット上の大多数の人は 1+1=2 であると信じています。

難易度はさらに上がりますが、ローカルで LLM を使用する必要がある場合、そのような問題を回避するにはどうすればよいでしょうか?

簡単かつ大雑把な方法は、2 つの LLM を同時に使用し、質問に答えるたびに 2 つの LLM が相互に検証するように規定することです。これが機能しない場合は、エラーが発生する可能性が低くなります。他の方法としては、2 人のユーザーが一度に 1 つのプロセスを処理し、1 人が質問を担当し、もう 1 人が質問を微調整する責任を負い、言語をより標準化して合理的にすることを試みます。

もちろん、インターネットでは問題を完全に回避できない場合もあります。たとえば、LLM が知的障害のあるバーから回答を取得する場合、状況は悪化する可能性があります。ただし、これらのデータを回避すると、利用可能なデータの量が減少するため、既存のデータが分割される可能性があります。実際、これは RAG (検索拡張生成) の自然言語理解です。

人間と機械は相互に理解する必要があります。複数の LLM が相互に理解して連携できるようにすると、本質的に AI エージェントの動作モードに触れることになります。つまり、人間のエージェントが他のリソースを呼び出します。これには大規模なモデルやモデルも含まれる場合があります。他のエージェント。

このことから、LLM と AI エージェントの関係を把握しました。LLM は人間が対話ウィンドウを通じてコミュニケーションできる知識の集合体ですが、実際には、いくつかの特定のタスクフローを特定の小さなプログラム、ボット、および命令セット、これらをエージェントとして定義します。

AI エージェントは依然として LLM の一部であり、この 2 つを同じものと見なすことはできません。AI エージェントの呼び出し方法は LLM に基づいており、特に外部プログラム、LLM および他のエージェントの連携に重点が置かれているため、AI エージェント = LLM となります。 +API感。

次に、LLM ワークフローに AI エージェントの命令を追加できます。例として X の API データを呼び出してみましょう。

人間のユーザーがチャットウィンドウを開きます。
ユーザーは自然言語、つまりテキストまたは音声を使用してニーズを説明します。
LLM はそれを API 呼び出しのような AI エージェントタスクに解析し、会話許可をエージェントに転送します。
AI エージェントはユーザー X にアカウントと API パスワードを要求し、ユーザーの説明に基づいてオンラインで X と通信します。
AI エージェントは最終結果をユーザーに返します。

人間とコンピューターの対話の進化の歴史をまだ覚えていますか? Web 1.0 と Web 2.0 に存在したブラウザーと API は今後も存在しますが、ユーザーはその存在を完全に無視して、AI エージェントの呼び出しのみを操作することができます。およびその他のプロセスは会話形式で使用でき、相手がインターフェースを開いてユーザーが許可を持っている限り、これらの API サービスはローカルデータ、ネットワーク情報、外部アプリデータなど、あらゆる種類のものにすることができます。それを使うために。

完全な AI エージェントの使用プロセスは、上の図に示されています。LLM は、AI エージェントとは別の部分と見なすことも、プロセスの 2 つのサブリンクと見なすこともできます。、ユーザーのニーズに応えます。

人間とコンピュータの対話プロセスの観点から見ると、ユーザーが自分自身と会話している場合でも、ユーザーは自分の考えや考えを表現するだけでよく、AI/LLM/AI エージェントがユーザーのニーズを何度も推測します。フィードバックメカニズムを追加し、LLM に現在の状況のコンテキスト (Context) を記憶するよう要求することで、AI エージェントが自分が行っていることを突然忘れないようにすることができます。

つまり、AI エージェントは、従来のスクリプトや自動化ツールとの本質的な違いであり、ユーザーの真のニーズを考慮する必要があります。推測の結果、L3 レベルの AI エージェントには人間の理解力や表現力が備わっていないため、外部 API に接続することは危険に満ちています。

AIフレームワークを収益化した後

AI フレームワークが収益化できるという事実は、私が Crypto に興味を持ち続ける重要な理由です。従来の AI テクノロジースタックでは、フレームワークはそれほど重要ではなく、少なくともデータやコンピューティング能力ほど重要ではありません。 AI 製品をフレームワークから収益化するのは困難です。結局のところ、ほとんどの AI アルゴリズムとモデルフレームワークはオープンソース製品であり、データなどの機密情報です。

本質的に、AI フレームワークまたはモデルは一連のアルゴリズムの容器と組み合わせであり、ガチョウを煮る鉄鍋に相当します。ただし、ガチョウの種類と火加減が味を区別する鍵となります。販売されている製品は本質的に異なります。それは大きなガチョウであるはずですが、現在、Web3 の顧客は真珠の箱を購入したいのに、ポットを購入してガチョウを放棄しています。

その理由は複雑ではありません。Web3 の AI 製品は基本的に、既存の AI フレームワーク、アルゴリズム、製品に基づいてカスタマイズされた製品であるため、技術的には大きな違いはありません。見分けがつかないため、名前やアプリケーションシナリオなどについて大騒ぎする必要があります。そのため、AI フレームワーク自体にいくつかの小さな調整を加えた結果、さまざまなトークンがサポートされるようになり、Crypto AI Agent のフレームワークバブルが発生しました。

学習データやアルゴリズムに多額の投資をする必要がないため、DeepSeek V3 がどれほど安価であっても、多くのドクターズヘアと GPU と電力消費が必要になります。

これはある意味、トークンよりもトークン発行プラットフォームの価値が高いという最近のWeb3の一貫したスタイルでもあり、Pump.Fun/Hyperliquidも同様で、エージェントは本来アプリケーションやアセットであるべきなのですが、代理発行フレームワークは最も人気のある製品になっています。

実際、これはさまざまなタイプのエージェント間の区別がないため、エージェントのフレームワークはより安定しており、資産発行の価値の吸い上げ効果を生み出すことができます。これは、Crypto の組み合わせの現在の 1.0 バージョンです。そしてAIエージェント。

2.0 バージョンが登場しており、通常は DeFi と AI エージェントの組み合わせです。DeFAI の概念はもちろん熱によって刺激された市場の動きですが、次の状況を考慮すると、それが異なることがわかります。

Morpho は、Aave などの古い融資商品に挑戦しています。
HyperliquidはdYdXのオンチェーンデリバティブを置き換え、さらにはBinanceのCEXリスト効果に挑戦しています。
ステーブルコインはオフチェーンシナリオの支払いツールになりつつあります。

DeFiの進化の背景には、AIがDeFiの基本ロジックを改良していることがあり、これまでのDeFiの最大のロジックがスマートコントラクトの実現可能性を検証することであったとしたら、AIエージェントはDeFiの製造ロジックを変更する必要はありません。 DeFi を理解するこの方法でのみ DeFi 製品を作成できます。これは、チェーンの抽象化よりもさらに基礎的な権限を与えます。

誰もがプログラマーとなり、複雑な計算を AI エージェントの背後にある LLM と API にアウトソーシングし、個人が自分のアイデアに集中するだけで、自然言語を効率的にプログラミングロジックに変換できる時代が到来します。

結論

この記事では、Crypto AI Agent のトークンとフレームワークについては触れていません。なぜなら、Cookie.Fun は AI エージェント情報の集約とトークン検出プラットフォーム、次に AI エージェントフレームワーク、そして最後にエージェント生成という十分な仕事をしてきたからです。コインが突然現れたり消えたりするため、記事に情報を記載し続けることに価値はありません。

ただし、この観察期間中、Crypto AI Agent が市場で何を指すのかについてはまだ本格的な議論が不足しています。メモリの変更が本質であると常に議論できるわけではありません。

さまざまな原資産を継続的に資産に変換できることこそが、クリプトの魅力です。

Recently Searched

Hot Coins

Trending

毎日の必読

おかえりなさい

アカウント登録

siteでログインする

siteで登録する

受信トレイを確認する

エージェントの進化、原点はテクニカルマーケティング

AI_Agent = LLM+API とします。

結論

全てのコメント

Recommended for you

Binance の資産管理、ワンクリックの暗号通貨購入、インスタント交換、VIP レンディング、レバレッジ取引機能は、Midnight (NIGHT) に利用可能になります。

2025年の主流パブリックブロックチェーンの収益実績は大きな乖離を示しました。Solanaは41億5000万ドルという巨額の純損失を記録しました。

セイラー氏はCPIデータが発表される前に保有ビットコインを2,038ビットコイン増やした。

トランプ氏：「イランには攻撃できる標的はほとんど残っていない」、そしてイランとの戦争はまもなく終わるだろう。

米国の消費者物価指数は予想通りだったが、米国の主要株価指数はまちまちで終了した。

ステーブルコインの時価総額が過去最高の3120億ドルを記録

イスラエル国防軍（IDF）は、イランからのミサイル発射を検知したと発表した。

米国の経済不況の確率は28％に低下した。

米国の消費者物価指数は2月に前年比2.4％上昇。市場では連邦準備制度理事会が7月に金利を引き下げると予想されている。

マスターカードが新たな「暗号通貨パートナープログラム」を開始

毎日の必読

OpenClaw: AIの「実行能力」を再定義する

なぜ暗号通貨はもう面白くなくなったのでしょうか?

112,000 件のポリマーケットアドレスを分析: 実際に利益を上げている上位 1% の人は、次の 5 つのことを行っています。

a16z: ステーブルコインの本当のチャンスは混乱にあるのではなく、ギャップを埋めることにあります。

コンピューティング能力をめぐる戦争が激化。「暗号通貨マイニングファーム」が「AI 工場」に変貌すると、新たなエネルギー裁定取引のテーブルが開かれる。

米国中間選挙の最初の一撃が放たれ、仮想通貨業界はトランプ大統領の仮想通貨推進政策を強く支持している。

人気のアクティビティ

RaveDAO at Terra Solis by Tomorrowland: A Female-Led Techno Night Where Web3 Culture Converges

人気のタグ

共有