Cointime

Download App
iOS & Android

AI は暗号通貨のエージェントです: AI エージェントの進化

Cointime Official

作者: ズオ・イエ

芸術作品は決して完成することはなく、放棄されるだけです。

誰もが AI エージェントについて話していますが、話している内容は同じではありません。これは、私たちが関心を持っている AI エージェントと一般の視点、および AI 実践者の視点との違いにつながります。

ずっと前に、私は「暗号は AI の幻想である」と書きましたが、当時から現在に至るまで、暗号と AI の組み合わせは報われない愛であり、AI の専門家が Web3/ブロックチェーンという用語を言及することはめったにありません。しかし、私は AI に情熱を持っており、AI エージェント フレームワークがトークン化できるという驚異を知った後、それが本当に AI 実践者を私たちの世界に導入できるかどうかはわかりません。

AI はクリプトの代理人である これは、今回の AI の急増をクリプトの観点から見るための最良の説明です。特に、クリプトの AI に対する熱意は、金融資産の発行と運用を統合することを望んでいます。

エージェントの進化、原点はテクニカルマーケティング

そのルーツを調査すると、AI エージェントには少なくとも 3 つのソースがあり、OpenAI の AGI (General Artificial Intelligence) はこれを重要なステップとして挙げており、この用語は技術レベルを超えたバズワードとなっています。ただし、本質的に、エージェントは新しい概念ではありません。これに AI のエンパワーメントを加えると、革命的な技術トレンドとは言えません。

1つは、OpenAIの観点からのAIエージェントであり、自動運転分類におけるL3に似ています。AIエージェントは、一定の高度な運​​転支援機能を備えていると見なされますが、完全に人間に取って代わることはできません。

画像の説明: OpenAI 計画の AGI 段階、画像出典: https://www.bloomberg.com/

第二に、AI エージェントは、名前が示すように、AI の恩恵を受けたエージェントです。OpenAI の計画の下では、エージェントは対話形式 (ChatGPT) と推論形式 (さまざまなボット) になります。 ) 最後の L3 ステージは、「特定の動作を自律的に実行する」こと、または LangChain の創設者である Harrison Chase の定義を使用することによって特徴付けられます。「AI エージェントは、LLM を使用するエージェントです。」プログラム制御フローの決定を行うためのシステム。」

これが謎なのですが、LLM が登場する前は、プログラマがクローラ プログラムを設計する際、エージェントは主に人為的に設定された自動処理を実行していました。もちろん、AI エージェントを使用して人間の動作をより詳細に模倣すると、AI エージェント クローラー フレームワークが表示され、クローラーが「より人間らしく」なります。

このような変更では、AI Agent の追加は既存のシナリオと組み合わせる必要があります。Curosr や Github copilot などのコード補完機能や生成機能も、LSP (Language Server Protocol) などに基づいています。考えてみると、これには多くの例があります。

  • Apple: AppleScript (スクリプトエディタ)--Alfred--Siri--ショートカット--Apple Intelligence
  • ターミナル: ターミナル (macOS)/Power Shell (Windows)--iTerm 2--Warp(AI ネイティブ)
  • 人間とコンピュータのインタラクション: Web 1.0 CLI TCP/IP Netscape Browser--Web 2.0 GUI/RestAPI/ Search Engine/Google/Super App--Web 3.0 AI Agent + dapp?

少し説明すると、人間とコンピュータのインタラクションのプロセスにおいて、Web 1.0 GUI とブラウザの組み合わせにより、Windows + IE の組み合わせに代表されるように、実際に公衆が何の障壁もなくコンピュータを使用できるようになります。API はデータの抽象化であり、API はデータの抽象化であり、 Web 2.0 時代のインターネットの背後にある伝送規格 ブラウザはすでに Chrome の時代を迎えており、モバイルへの移行により人々のインターネット利用習慣が変化しました。WeChat や Meta などのスーパー プラットフォームのアプリが人々の生活のあらゆる側面をカバーしています。 。

第三に、暗号分野におけるインテントの概念は、AI エージェント サークルの爆発的な前兆です。ただし、これは不完全なビットコイン スクリプトからイーサリアム スマート コントラクトまで、エージェントの概念自体が暗号内でのみ有効であることに注意してください。広く使用され、その後生み出されたクロスチェーンブリッジ - チェーン抽象化、EOA - AA ウォレットはすべてこの種の考え方の自然な拡張であるため、AI エージェントが暗号通貨に「侵入」した後、DeFi につながりました。この光景は驚くことではありません。

ここで、Crypto の文脈で AI エージェントの概念が混乱します。私たちが実際に実現したいのは、「自動的に財務を管理し、新しいミームを自動的に作成する」エージェントです。しかし、OpenAI の定義では、そのような危険なシナリオさえも必要になります。 L4 /L5 は本当に実現できますが、一般の人が遊んでいるのは自動コード生成や AI ワンクリック要約、ゴーストライティングなどの機能です。両者間のコミュニケーションは同じ次元ではありません。

私たちが本当に望んでいることは理解できたので、AI エージェントの組織ロジックに焦点を当てましょう。技術的な詳細は後で隠します。結局のところ、AI エージェントのコンセプトは、大規模な普及の障害からテクノロジーを取り除くことです。このツールはパーソナル PC 業界にミダス的な影響を与えているため、人間とコンピューターのインタラクションの観点から AI エージェントを考察することと、AI エージェントとそれをリードする LLM の違いとつながりの 2 点に焦点を当てます。第三部へ: 暗号と AI エージェント この組み合わせは最終的に何も残さない。

AI_Agent = LLM+API とします。

ChatGPT などのチャットベースの人間とコンピューターの対話モデルが登場する前は、人間とコンピューター間の対話は主に GUI (グラフィカル インターフェイス) と CLI (コマンド ライン インターフェイス) の形式で行われ、GUI の考え方はブラウザー、アプリ、その他の特定のものを導き出し続けました。フォーム、CLI とシェルの組み合わせはほとんど変更されません。

しかし、これは人間とコンピューターの「フロントエンド」の表面上のやりとりにすぎません。インターネットの発展に伴い、データの量と種類が増加することで、データ間の「バックエンド」のやりとりも増加しています。単純な Web ブラウジング動作であっても、実際には 2 つの連携と協力が必要です。

しかし、これは人間とコンピューターの「フロントエンド」の表面上のやりとりにすぎません。インターネットの発展に伴い、データの量と種類が増加することで、データ間の「バックエンド」のやりとりも増加しています。単純な Web ブラウジング動作であっても、実際には 2 つの連携と協力が必要です。

人とブラウザとアプリの間のインタラクションについて言えば、ユーザーポータルについて話しますが、実際には、これも一般のユーザーには必要のない、インターネットの実際の操作をサポートするものです。コマンドラインやAPIなどの用語を理解することで目的を達成することができます。

LLM についても同様であり、ユーザーはさらに一歩進んで、プロセス全体を次の手順のように記述することができます。

  1. ユーザーがチャット ウィンドウを開きます。
  2. ユーザーは自然言語、つまりテキストまたは音声を使用してニーズを説明します。
  3. LLM はそれを解析して合理化された操作ステップに変換します。
  4. LLM は結果をユーザーに返します。

このプロセスでは、最大の課題は Google であることがわかります。ユーザーは検索エンジンを開く必要はなく、GPT のようなさまざまなダイアログ ウィンドウを開く必要があり、トラフィックの入り口が静かに変化しているためです。この LLM は検索エンジンの生活に革命をもたらすと考えています。

では、AI エージェントはこの中でどのような役割を果たしているのでしょうか?

一言で言えば、AI Agent は LLM を専門化したものです。

現在の LLM は AGI ではありません。つまり、OpenAI の理想的な L5 オーガナイザーではありません。たとえば、ユーザーが情報を入力しすぎると幻覚を引き起こしやすいことが挙げられます。たとえば、トレーニング メカニズムで GPT 1+1=3 を繰り返し指示すると、次のインタラクションでは一定の確率で 1+1+1= が要求されます。答えが 4 である確率を示します。

現時点での GPT のフィードバックは完全に個人ユーザーからのものであるため、モデルがインターネットに接続されていない場合、今後は、ユーザーの情報によって動作メカニズムが変更される可能性があります。 1+1=3 はわかりますが、モデルがインターネットに接続できる場合、GPT のフィードバック メカニズムはより多様になります。結局のところ、インターネット上の大多数の人は 1+1=2 であると信じています。

難易度はさらに上がりますが、ローカルで LLM を使用する必要がある場合、そのような問題を回避するにはどうすればよいでしょうか?

簡単かつ大雑把な方法は、2 つの LLM を同時に使用し、質問に答えるたびに 2 つの LLM が相互に検証するように規定することです。これが機能しない場合は、エラーが発生する可能性が低くなります。他の方法としては、2 人のユーザーが一度に 1 つのプロセスを処理し、1 人が質問を担当し、もう 1 人が質問を微調整する責任を負い、言語をより標準化して合理的にすることを試みます。

もちろん、インターネットでは問題を完全に回避できない場合もあります。たとえば、LLM が知的障害のあるバーから回答を取得する場合、状況は悪化する可能性があります。ただし、これらのデータを回避すると、利用可能なデータの量が減少するため、既存のデータが分割される可能性があります。実際、これは RAG (検索拡張生成) の自然言語理解です。

人間と機械は相互に理解する必要があります。複数の LLM が相互に理解して連携できるようにすると、本質的に AI エージェントの動作モードに触れることになります。つまり、人間のエージェントが他のリソースを呼び出します。これには大規模なモデルやモデルも含まれる場合があります。他のエージェント。

このことから、LLM と AI エージェントの関係を把握しました。LLM は人間が対話ウィンドウを通じてコミュニケーションできる知識の集合体ですが、実際には、いくつかの特定のタスク フローを特定の小さなプログラム、ボット、および命令セット、これらをエージェントとして定義します。

AI エージェントは依然として LLM の一部であり、この 2 つを同じものと見なすことはできません。AI エージェントの呼び出し方法は LLM に基づいており、特に外部プログラム、LLM および他のエージェントの連携に重点が置かれているため、AI エージェント = LLM となります。 +API感。

次に、LLM ワークフローに AI エージェントの命令を追加できます。例として X の API データを呼び出してみましょう。

  1. 人間のユーザーがチャット ウィンドウを開きます。
  2. ユーザーは自然言語、つまりテキストまたは音声を使用してニーズを説明します。
  3. LLM はそれを API 呼び出しのような AI エージェント タスクに解析し、会話許可をエージェントに転送します。
  4. AI エージェントはユーザー X にアカウントと API パスワードを要求し、ユーザーの説明に基づいてオンラインで X と通信します。
  5. AI エージェントは最終結果をユーザーに返します。

人間とコンピューターの対話の進化の歴史をまだ覚えていますか? Web 1.0 と Web 2.0 に存在したブラウザーと API は今後も存在しますが、ユーザーはその存在を完全に無視して、AI エージェントの呼び出しのみを操作することができます。およびその他のプロセスは会話形式で使用でき、相手がインターフェースを開いてユーザーが許可を持っている限り、これらの API サービスはローカル データ、ネットワーク情報、外部アプリ データなど、あらゆる種類のものにすることができます。それを使うために。

完全な AI エージェントの使用プロセスは、上の図に示されています。LLM は、AI エージェントとは別の部分と見なすことも、プロセスの 2 つのサブリンクと見なすこともできます。 、ユーザーのニーズに応えます。

人間とコンピュータの対話プロセスの観点から見ると、ユーザーが自分自身と会話している場合でも、ユーザーは自分の考えや考えを表現するだけでよく、AI/LLM/AI エージェントがユーザーのニーズを何度も推測します。フィードバック メカニズムを追加し、LLM に現在の状況のコンテキスト (Context) を記憶するよう要求することで、AI エージェントが自分が行っていることを突然忘れないようにすることができます。

つまり、AI エージェントは、従来のスクリプトや自動化ツールとの本質的な違いであり、ユーザーの真のニーズを考慮する必要があります。推測の結果、L3 レベルの AI エージェントには人間の理解力や表現力が備わっていないため、外部 API に接続することは危険に満ちています。

AIフレームワークを収益化した後

AI フレームワークが収益化できるという事実は、私が Crypto に興味を持ち続ける重要な理由です。従来の AI テクノロジー スタックでは、フレームワークはそれほど重要ではなく、少なくともデータやコンピューティング能力ほど重要ではありません。 AI 製品をフレームワークから収益化するのは困難です。結局のところ、ほとんどの AI アルゴリズムとモデル フレームワークはオープンソース製品であり、データなどの機密情報です。

本質的に、AI フレームワークまたはモデルは一連のアルゴリズムの容器と組み合わせであり、ガチョウを煮る鉄鍋に相当します。ただし、ガチョウの種類と火加減が味を区別する鍵となります。販売されている製品は本質的に異なります。それは大きなガチョウであるはずですが、現在、Web3 の顧客は真珠の箱を購入したいのに、ポットを購入してガチョウを放棄しています。

その理由は複雑ではありません。Web3 の AI 製品は基本的に、既存の AI フレームワーク、アルゴリズム、製品に基づいてカスタマイズされた製品であるため、技術的には大きな違いはありません。見分けがつかないため、名前やアプリケーションシナリオなどについて大騒ぎする必要があります。そのため、AI フレームワーク自体にいくつかの小さな調整を加えた結果、さまざまなトークンがサポートされるようになり、Crypto AI Agent のフレームワークバブルが発生しました。

学習データやアルゴリズムに多額の投資をする必要がないため、DeepSeek V3 がどれほど安価であっても、多くのドクターズ ヘアと GPU と電力消費が必要になります。

これはある意味、トークンよりもトークン発行プラットフォームの価値が高いという最近のWeb3の一貫したスタイルでもあり、Pump.Fun/Hyperliquidも同様で、エージェントは本来アプリケーションやアセットであるべきなのですが、代理発行フレームワークは最も人気のある製品になっています。

実際、これはさまざまなタイプのエージェント間の区別がないため、エージェントのフレームワークはより安定しており、資産発行の価値の吸い上げ効果を生み出すことができます。これは、Crypto の組み合わせの現在の 1.0 バージョンです。そしてAIエージェント。

2.0 バージョンが登場しており、通常は DeFi と AI エージェントの組み合わせです。DeFAI の概念はもちろん熱によって刺激された市場の動きですが、次の状況を考慮すると、それが異なることがわかります。

2.0 バージョンが登場しており、通常は DeFi と AI エージェントの組み合わせです。DeFAI の概念はもちろん熱によって刺激された市場の動きですが、次の状況を考慮すると、それが異なることがわかります。

  • Morpho は、Aave などの古い融資商品に挑戦しています。
  • HyperliquidはdYdXのオンチェーンデリバティブを置き換え、さらにはBinanceのCEXリスト効果に挑戦しています。
  • ステーブルコインはオフチェーンシナリオの支払いツールになりつつあります。

DeFiの進化の背景には、AIがDeFiの基本ロジックを改良していることがあり、これまでのDeFiの最大のロジックがスマートコントラクトの実現可能性を検証することであったとしたら、AIエージェントはDeFiの製造ロジックを変更する必要はありません。 DeFi を理解する この方法でのみ DeFi 製品を作成できます。これは、チェーンの抽象化よりもさらに基礎的な権限を与えます。

誰もがプログラマーとなり、複雑な計算を AI エージェントの背後にある LLM と API にアウトソーシングし、個人が自分のアイデアに集中するだけで、自然言語を効率的にプログラミング ロジックに変換できる時代が到来します。

結論

この記事では、Crypto AI Agent のトークンとフレームワークについては触れていません。なぜなら、Cookie.Fun は AI エージェント情報の集約とトークン検出プラットフォーム、次に AI エージェント フレームワーク、そして最後にエージェント生成という十分な仕事をしてきたからです。コインが突然現れたり消えたりするため、記事に情報を記載し続けることに価値はありません。

ただし、この観察期間中、Crypto AI Agent が市場で何を指すのかについてはまだ本格的な議論が不足しています。メモリの変更が本質であると常に議論できるわけではありません。

さまざまな原資産を継続的に資産に変換できることこそが、クリプトの魅力です。

コメント

全てのコメント

Recommended for you

  • 米上院銀行委員会の委員長は、ステーブルコインの利回りに関する新たな草案が早ければ今週中にも公表される可能性があると述べた。

    Cointimeの報道によると、上院銀行委員会の委員長を務めるティム・スコット上院議員は、ワシントンD.C.で開催されたブロックチェーンサミットで、議員らは早ければ今週中にも、少なくともステーブルコイン関連の条項を含む新たな法案草案を目にする可能性があると述べた。スコット議員は、法案の中で最も注目を集めているのはステーブルコインの利回り問題だが、議員らは引き続きこの問題に取り組んでいると指摘した。 スコット議員は、「今週中に最初の提案が提出されるだろう。もしそれが週末までに実現すれば、少なくとも法案の枠組みが形になりつつあるかどうかが分かるだろう。そうなれば、我々はより良​​い状況に立てると思う」と述べた。また、ステーブルコインの利回り問題に関して、民主党のアンジェラ・アルソブルックス上院議員、共和党のトム・ティリス上院議員、そしてホワイトハウス高官のパトリック・ウィット氏の尽力も、この進展に貢献していると述べた。 スコット氏は、過去1か月間の交渉で、ドナルド・トランプ大統領とその家族の暗号資産プロジェクトに対する議員の懸念、主要な規制機関における超党派代表の欠如、顧客確認(KYC)規制など、その他の未解決問題も取り上げられたと述べた。 スコット氏はまた、「倫理問題と定足数については、合意に非常に近づいていると思います。これは相手側にとっても重要な問題だと認識しているので、こちらも対応しています。また、いくつかの人事についても進展が見られており、これは良いニュースです。DeFiに関しては、マーク・ワーナー上院議員が注力している分野であり、マネーロンダリング対策(AML)は非常に重要な要素です。これらの問題についても前進していると思います」と述べた。

  • ゴールデンモーニングブリーフィング|3月18日の主要な夜間動向

    21:00~7:00 キーワード:ファントムウォレット、ストライプウォレット、オートノマスウォレット、イラン 1. イランは、米国とイスラエルが自国領土を使用することを容認する国に対して、合法的に攻撃できると主張している。 2. 米国CFTC(商品先物取引委員会)は、ファントムウォレットはブローカーとしての登録を必要としないと発表。 3. アリゾナ州司法長官は、予測マーケティング担当者のカルシ氏を刑事告発。 4. 米国国務省は、世界中のすべての在外公館に対し、「直ちに」安全保障評価を実施するよう命じた。 5. ロビンフッド・ベンチャーキャピタルは、ストライプウォレットとイレブンラボに約3500万ドルを投資。 6. GSRは、オートノマスウォレットとアーキテックを買収するために5700万ドルを投資し、暗号資産ファンド管理プラットフォームを構築。 7. 米国証券取引委員会(SEC)とCFTCは、ほとんどのデジタル資産は証券ではないとする新たな暗号資産ガイダンスを発表。

  • 米国証券取引委員会(SEC)と商品先物取引委員会(CFTC)は、仮想通貨に関する新たな見解を発表し、ほとんどのデジタル資産は証券の範疇には含まれないとした。

    Cointimeは3月18日、米国証券取引委員会(SEC)と商品先物取引委員会(CFTC)が暗号資産に関する68ページのガイダンス文書を公表し、ほとんどのデジタル資産は証券ではないと明記したと報じた。この新たな説明では、ステーブルコイン、デジタル商品、および「デジタル商品」トークンの分類が詳細に説明されており、これらはすべて証券ではないと両機関は述べている。また、「非証券暗号資産」がどのようにして証券になり得るのかを説明し、マイニング、プロトコルステーキング、エアドロップに連邦証券法がどのように適用されるのかを明確にしている。 SECはさらに、非証券デジタル資産が投資契約の対象となる仕組みについても説明している。SECの説明によると、「非証券暗号資産は、発行者が投資家に対し共同事業への投資を促し、必要な経営業務を行うという約束または表明を行い、かつ購入者がそこから利益を得ると期待する理由がある場合に、投資契約の対象となる」。

  • マスターカードは、ステーブルコイン企業であるBVNKを最大18億ドルで買収する計画だ。

    Cointimeの報道によると、Mastercardはステーブルコインインフラのスタートアップ企業であるBVNKを、条件付き買収額3億ドルを含め最大18億ドルで買収する計画だ。この買収は、BVNKとCoinbaseの約20億ドル規模の合併交渉が決裂してからわずか4ヶ月後のことである。両社は火曜日に発表した共同声明で、この取引を確認した。

  • ビットコインは8日間連続で上昇し、76,000ドルに達した。混乱の中で金価格を上回るパフォーマンスを見せている背景には、どのような論理があるのだろうか?

    戦争が沈静化し、原油価格が下落し、米国株が回復する中、ビットコインは今回、どのような方向へ向かうのだろうか?

  • トークンが売れない?それは、仮想通貨プロジェクトの90%が投資家向け広報を怠っているからだ。

    この1年間、私たちは暗号資産分野の主要プロジェクトのほぼすべてと協力して投資家向け広報システムを構築し、すでに20以上のプロジェクトにサービスを提供してきました。この記事は、すぐに活用できる投資家コミュニケーションの実践的なガイドです。

  • Meta社は従業員の20%を解雇し続けている。これはAI時代の「効率化革命」なのか、それともコスト不安の表れなのか?

    Metaは、表向きはコスト削減のため従業員の20%を削減する計画だが、これはAIの効率化が進んでいる兆候かもしれない。ウォール街は、同社が「AIファースト」を目指した組織再編を加速させており、競合他社との差がさらに広がる可能性があると見ている。

  • 大統領にあなたの投稿を支持してもらうには、ミームコインがいくら必要?マイリー:500万。

    北京時間3月17日、アルゼンチンの地元メディアEl Destapeは独占スクープを報じた。捜査当局がアルゼンチンの仮想通貨ロビイストの携帯電話からデータを回収し、アルゼンチンのミリー大統領が1年前にLIBRAについてツイートしたのは500万ドルの賄賂を受け取ったためであり、その扇動者は以前から推測されていた通りヘイデン・デイビスだったことを明らかにした。

  • カルシ氏は10億ドル相当の無料宝くじを配布しました。忘れずに削ってください!

    朗報です。ジャックポットは実在します。残念なことに、当選確率は1兆2000億分の1です…。

  • ウォール街の「トロイの木馬」:ICEによるOKXへの投資の背景にある権力構造の再編とインフラ統合の分析

    これは単なる金融取引ではなく、旧来の金融システムが資本レバレッジとコンプライアンス構造を利用して、新興の暗号通貨市場における権力構造を上から下へと再構築しようとする試みである。