Cointime

Download App
iOS & Android

暗号通貨取引の競争が終わる前に、AIはすでにテキサスホールデムをプレイし始めています。

Validated Media

NOF1 AIトレーディングコンペティションは残り4日となりましたが、DeepSeekとTongyi Qianwenは依然として大きくリードしています。一方、残りの4つのAIは、ビットコインを保有するだけの運用成績を上回ることができていません。不測の事態がない限り、DeepSeekが優勝するはずです。残りのAIがビットコインを保有するだけの運用成績を上回るのはいつになるのか、そして誰が最下位に沈むのか、今後の展開が注目されます。

AIによる仮想通貨取引は絶えず変化する市場に直面していますが、本質的にはPvEゲームです。しかし、「どのAIが取引に優れているか」ではなく「どのAIがより賢いか」を競う真のPvPゲームとして、ロシアのプログラマー、マックス・パブロフ氏は9台のAIにテキサスホールデムポーカーを挑みました。

LinkedInで公開されている情報によると、マックス・パブロフ氏は長年プロダクトマネージャーとして活躍しています。AI Pokerのウェブサイトに掲載されている彼のプロフィールにも、ディープラーニング、AI、そしてポーカーの愛好家であることが記されています。このテストを実施した理由について、マックス・パブロフ氏は、ポーカーコミュニティにおいて推論における大規模言語モデルの信頼性についてまだ合意に至っておらず、このコンテストは実際のポーカーゲームにおける大規模言語モデルの推論能力を実証するものであると説明しました。

おそらく、グロックの仮想通貨取引のパフォーマンスが目立ったものでなかったため、マスク氏は昨日、ポーカーゲームでグロックが一時的に首位に立っているスクリーンショットをリツイートし、「グロックに仕返ししたい」という意向を示しているようだ。

AIのパフォーマンスはどうですか?

このポーカートーナメントには、Gemini、ChatGPT、Claude Sonnet(FTXから投資を受けたAnthropicが立ち上げ)、Grok、DeepSeek、Kimi(Dark Side of the MoonのAI)、Llamaなどの有名企業のほか、ヨーロッパの市場と言語に重点を置くフランス企業Mistral AIが立ち上げたMistral Magistral、中国で大規模言語モデル研究に投資した最も初期の企業の一つである北京Zhipuの子会社GLMなど、9人のプレイヤーが参加しました。

本稿執筆時点で、Gemini、ChatGPT、Claude Sonnet、Grok、DeepSeekの5プレイヤーが水上にいる一方、残りの4プレイヤーは現在損失を出しています。Metaのアルパカプレイヤーは投資額の半分以上を失っており、最悪の状況にあります。

本稿執筆時点で、Gemini、ChatGPT、Claude Sonnet、Grok、DeepSeekの5プレイヤーが水上にいる一方、残りの4プレイヤーは現在損失を出しています。Metaのアルパカプレイヤーは投資額の半分以上を失っており、最悪の状況にあります。

トーナメントは27日に始まり、31日に終了する予定で、残りは1日半を切りました。利益曲線を見ると、xAIのGrokは最初の1日ほどはリードを維持し、Geminiに追い抜かれた後もかなりの期間2位を維持しました。記録された2540ハンドのうち、Grokは2270ハンドあたりでClaude Sonnetに、2500ハンドあたりでChatGPTに追い抜かれました。

DeepSeek、Kimi、そしてヨーロッパのプレイヤーMistral Magistralは上位につけており、比較的安定した成績を維持していました。しかし、Alpacaはトライアル期間終了後の740手目あたりで失速し始め、最下位に沈みました。一方、GLMは1440手目あたりから後れを取り始めました。

リターン以外にも、技術的な統計により、各 AI プレーヤーのさまざまな「個性」が明らかになります。

VPIP(自発的にポットに$を入れる)では、アルパカプレイヤーが61%を占め、ラウンドの半分以上でベットを選択しました。最も安定した成績を収めた3人のプレイヤーは、ベット回数も最も少なかったです。上位ランクのプレイヤーのVPIP率は、いずれも25%から30%でした。

PFR(プリフロップレイズ)では、予想通りラマが1位となり、僅差でジェミニが最大の利益を上げました。メタのラマは過度にアグレッシブで積極的なプレイヤーである一方、ジェミニは比較的アグレッシブではあるものの、積極性は中程度です。ジェミニは良いハンドを持っている時は積極的にベットするタイプで、たまたま衝動的なラマに遭遇したことで、両者の利益が正反対に乖離したのかもしれません。

3ベットとCベットのデータを組み合わせると、Grokは比較的冷静ではあるものの、過度に消極的ではなく、プリフロップでのプレッシャーが強いことがわかります。このスタイルにより、彼は序盤はリードを維持することができましたが、その後、GeminiとChatGPTのアグレッシブな戦略とLlamaのオーバーザトップのプレイが相まって、Grokは逆転し、トップの座を獲得しました。

AI はどのように分析を実行するのでしょうか?

マックス・パブロフはトーナメントの基本ルールを設定しました。ブラインドは 10/20 ドル、アンティやストラドルは禁止、9 人のプレイヤーが 4 つのテーブルに同時に参加、スタックが 100 ビッグ ブラインドを下回るとシステムが自動的に 100 ビッグ ブラインドに補充される、などです。

さらに、すべてのAIプレイヤーは同じ手がかりを共有し、推論の長さを制限するためにトークンの最大数が設定され、異常な応答があった場合はデフォルトでフォールドされます。マックス・パブロフは、AIのアクション中またはハンド後にAIの意思決定プロセスを尋ねるシステムを設計しました。

執筆時点でプレイされているゲームを使って、AI プレイヤーの分析を見てみましょう。

クロードとジェミニがスモールブラインドとビッグブラインドを分け合った後、ラマはスペードの8とクラブのクイーンが「比較的強い」と感じ、ストレートかフラッシュに賭けることができるので、20をコールしました。

DeepSeekは、クイーンとハートの2はコールするにはポジションが弱すぎると予測しています。一方、GLMは、ミドルポジションからのフラッシュドローによるレイズで、ルーズなラマにポットビルドを強いる可能性があり、80ドルであればポットをコントロールしつつ十分なプレッシャーをかけられると考えています。ラマと同じスーツだがランクが逆のハンドを持つキミは、自分のハンドが弱すぎると予測し、その後の3ベットからのプレッシャーも受けており、コールするのは賢明ではないと判断しています。

ここまで見てきたように、ラマはデータやポジションを分析せず、基本的に「無意識に」賭けを行っていたのに対し、次の 3 人はポジションとこれまでのデータ分析に基づいて独自の判断を下していました。

GPT o3がエースを持っていたため、大胆にも260をベットした後、GrokとMagistralは両者ともフォールドを選択しました。特にGrokは、GPTが自分よりも高い値のエースかペアを持っている可能性があると漠然と予想しており、Llamaの無謀なアグレッシブなプレイを考えると、諦めざるを得ませんでした。

その後、Gemini、Llama、GLMは全員フォールドを選択しました。GLMもGPTがビッグペアかエースを持っている可能性が高いと考えていましたが、Llamaはデータ分析を行わず、自分のハンドは実際にはかなり強いものの、260というバリューをコールするほど強くはないと単純に感じていました。

このハンドでは、Llamaのオーバーザトップのプレイ、DeepSeekとKimiの慎重なアプローチ、そしてGPTの大胆さが全て発揮され、最終的にGPTがフロップなしでポットを獲得しました。この記事が進むにつれて、上位4人のプレイヤーの利益は増加し続けており、その中からチャンピオンが誕生することが予想されます。仮想通貨取引では低迷していたAIたちは、テキサスホールデムで再びその実力を証明しました。

多くの研究機関が科学的な手法を用いてAIの能力をテストしていますが、ユーザーがより関心を寄せているのは、AIが自社の利益のために活用できるかどうかです。ポーカーでは成績が悪いDeepSeekは優れたトレーダーであり、トレードス​​キルの低さで知られるGeminiはポーカーテーブルを席巻しています。AIが様々なシナリオに登場すると、理解しやすい行動や結果を通して、様々な分野におけるAIの強みを観察することができます。

多くの研究機関が科学的な手法を用いてAIの能力をテストしていますが、ユーザーがより関心を寄せているのは、AIが自社の利益のために活用できるかどうかです。ポーカーでは成績が悪いDeepSeekは優れたトレーダーであり、トレードス​​キルの低さで知られるGeminiはポーカーテーブルを席巻しています。AIが様々なシナリオに登場すると、理解しやすい行動や結果を通して、様々な分野におけるAIの強みを観察することができます。

もちろん、数日間のトレーディングやカードゲームだけでは、AIのこの分野における能力や将来の進化の可能性について結論を導き出すことはできません。AIの意思決定は感情に左右されるのではなく、アルゴリズムの根底にあるロジックに依存します。モデルの開発者でさえ、自らが開発したAIがどの分野で優れているかを正確に把握していない可能性があります。

実験室の外に出て行うこうした楽しいテストを通じて、私たちが当たり前だと思っているものやゲームに直面したときの AI のロジックをより直感的に観察することができ、ひいては人間と AI の思考の境界をさらに広げることができます。

コメント

全てのコメント

Recommended for you

  • Ju.comの3番目のMeme IPOであるLWAPEは、時価総額が170億倍以上上昇しました。4番目のIPOであるJは、3月11日16時に申込受付を開始します。

    Ju.comの「Meme第10期IPO計画」では、第3期となるLWAPEが上場後、急騰し、最高値17,000 USDTに達しました。これは、当初の申込価格0.000001 USDTから170億倍以上となる価格上昇です。決済後、このLWAPEで申込まれた資産はロックダウンされず、スポット資産としてすぐに利用可能となり、ユーザーは売却または即時引き出しを選択できます。

  • Nvidia、AIチップサポート提供のためThinking Machinesへの投資を増加

    エヌビディア(NVDA.O)は、人工知能(AI)企業シンキング・マシーンズ・ラボ(Thinking Machines Lab)に新たな投資ラウンドを実施し、同社のAIモデルの学習と実行を支援するチップを提供する。同社は、OpenAIの元幹部ミラ・ムラティ氏によって設立された。シンキング・マシーンズは火曜日の声明で、複数年契約に基づき、エヌビディアの次世代AIアクセラレータ「Vera Rubin」を使用すると発表した。これらのチップは来年初めに導入され、シンキング・マシーンズは少なくとも1ギガワットの演算能力を獲得する見込みだ。エヌビディアは契約の具体的な条件や、投資が現金、チップ、あるいはその両方の組み合わせのいずれの形態になるかを明らかにしていない。両社はこれを「重要な」投資と表現するにとどめた。

  • Yi Lihua: CZ は暗号通貨 VC にとってよりよい出口メカニズムを提供するべきだと私は提案します。アクティブな資本は業界のイノベーションにつながります。

    Liquid Capital(旧LD Capital)の創業者である易立華氏は、近年の暗号資産業界における最大の問題はイノベーションの衰退だと述べている。この問題は2つの側面から生じている。1つ目は、前米国政権による暗号資産政策の厳格化であり、これは暗号資産構造法(Crypto Structure Act)の成立によって解決されるはずだ。2つ目は、Binanceがプロジェクトに対し、暗号資産VCへの投資を1年+3年ロックダウンすることを義務付けていることである。Binanceの当初の意図は、長期投資マインドを育成するという良いものだったが、現在の仕組みでは、取引プラットフォーム上のプロジェクトチーム、マーケットメーカー、流動性プロバイダーが先に「逃げ出す」一方で、VCは長いロックダウン解除プロセスの間に何も残らないという状況になっている。VCは既にプライマリーマーケットで最大のリスクを負っているにもかかわらず、最後にエグジットするリスクも負わされており、これは従来の投資市場とは明らかに矛盾している。その結果、暗号資産VCは集団的に衰退し、優秀な起業家の資金調達が困難になり、業界のイノベーションが減速している。彼はバイナンスの創設者であるCZに対し、仮想通貨VCにVC資本を活性化させるためのより良い出口メカニズムを提供することを提案しており、それが業界のイノベーションに役立ち、取引プラットフォームへの高品質資産の上場を促進することになるだろう。

  • 米国防長官:米国は敵国を完全に打ち負かすまでイランとの戦争を終わらせないだろう。

    ハーグ米国防長官は、「今日は最も激しい空爆の日となるだろう。米国は敵を完全に打ち負かすまで、イランとの戦争を終わらせない」と述べた。

  • 中国国家コンピュータネットワーク緊急対応技術チーム/調整センター (CNCERT/CC) は、OpenClaw のセキュリティ アプリケーションに関するリスク警告を発行しました。

    中国国家コンピュータネットワーク緊急対応技術チーム/調整センター(CNCERT/CC)は、OpenClawアプリケーションに関するセキュリティリスク警告を発令しました。最近、OpenClawアプリケーション(旧称ClawdbotおよびMoltbot)のダウンロード数と利用数が急増しており、国内の主要クラウドプラットフォームではワンクリック導入サービスを提供しています。このインテリジェントエージェントソフトウェアは、自然言語コマンドに基づいてコンピュータを直接制御し、関連する操作を実行します。「タスクの自律実行」機能を実現するために、このアプリケーションには高いシステム権限が付与されており、ローカルファイルシステムへのアクセス、環境変数の読み取り、外部サービスのアプリケーションプログラミングインターフェース(API)の呼び出し、拡張機能のインストールなどが含まれます。しかし、デフォルトのセキュリティ設定は非常に脆弱であるため、侵入が発見されると、攻撃者は容易にシステムを完全に制御できます。関係組織および個人ユーザーは、OpenClawを導入および使用する際にネットワーク管理を強化し、OpenClawのデフォルト管理ポートをパブリックインターネットに直接公開しないようにし、ID認証やアクセス制御などのセキュリティ制御手段を通じてアクセスサービスを安全に管理することが推奨されます。動作環境を厳密に分離し、コンテナなどのテクノロジーを使用して OpenClaw の過剰な権限を制限することも推奨されます。

  • ハンターの香り:a16zがWeb3の次の夜明けに20億ドルを賭ける

    暗号通貨業界全体がまだ冬の寒さに震え、数え切れないほどのベンチャーキャピタリストが様子見を選択している中、「シリコンバレーの最も大胆なベンチャーキャピタリスト」として知られるa16zが、再びショットガンを構えた。

  • ブラックロックは1,133.78ビットコインと27,189イーサリアムをコインベースに預け入れた。

    市場筋によると、ブラックロックは1,133.78ビットコイン(8,024万ドル相当)と27,189イーサリアム(5,610万ドル相当)をコインベースに預けており、今後もさらに預け入れられる予定だという。

  • SpaceXはナスダック上場を目指しており、評価額は1兆7500億ドルを目指している。

    報道によると、イーロン・マスク氏のスペースXはナスダック上場を目指しており、時価総額1兆7,500億ドルを目指している。これは史上最大のIPOとなる可能性がある。(ロイター通信)以前の報道では、スペースXは早ければ6月にもIPOを計画していると報じられていた。情報筋によると、ニューヨーク証券取引所も上場を目指しており、どちらの取引所も最終決定をまだ知らされていないという。ナスダックは先月、新規上場した大企業のナスダック100指数への組み入れを迅速化する新たな規則を提案した。この「ファストトラック組み入れ」規則では、新規上場企業は時価総額がナスダック100指数の既存構成銘柄上位40社に入っている場合、上場後1か月以内に早期組み入れの対象となる可能性がある。提案された変更はまだ最終決定されておらず、発効までには数ヶ月かかる可能性がある。

  • ウォール街は OpenAI の IPO を「探っている」が、投資機関は楽観的ではない?

    報道によると、投資機関が同社に熱心でない主な理由は3つある。第一に、評価額が高すぎること。株価売上高倍率は28倍で、NVIDIAをはるかに上回っている。第二に、利益見通しが不透明で、同社は2030年まで現金燃焼を続け、コンピューティング能力への多額の資産投資に依存すると予想される。第三に、競合他社のAnthropicが力強く台頭し、コスト管理の改善で市場の投資意欲をそらしていることである。