DeepSeekが6710億のパラメータを持つProver-V2モデルをリリース

DeepSeekは本日、AIオープンソースコミュニティHugging FaceでDeepSeek-Prover-V2-671Bという新しいモデルをリリースしました。 DeepSeek-Prover-V2-671B は、より効率的なセーフテンソルファイル形式を使用し、複数の計算精度をサポートすることで、より高速でリソースを節約したモデルのトレーニングと展開を可能にすると報告されています。このモデルは6,710億個のパラメータを持ち、昨年リリースされたProver-V1.5数学モデルのアップグレード版である可能性がある。モデルアーキテクチャの面では、このモデルは DeepSeek-V3 アーキテクチャを使用し、MoE (Mixture of Experts) モードを採用し、61 個の Transformer 層と 7168 次元の隠し層を備えています。また、最大位置埋め込みが 163,800 の超長いコンテキストもサポートしており、複雑な数学的証明を処理できます。また、FP8 量子化も使用しており、量子化技術によってモデルサイズを縮小し、推論効率を向上させることができます。（ゴールデンテン）

Recently Searched

Hot Coins

Trending

毎日の必読

おかえりなさい

アカウント登録

siteでログインする

siteで登録する

受信トレイを確認する

DeepSeekが6710億のパラメータを持つProver-V2モデルをリリース

全てのコメント

Recommended for you

Nexswapが正式に開始され、Nexus Chainエコシステムの開発が加速し、オンチェーンアクティビティが継続的に増加しています。

NexusChainSwap が正式に開始され、Nexus Chain エコシステムの開発が加速し、オンチェーンアクティビティが継続的に増加しています。

BTCが88,000ドルを下回る

米議員らは、200ドル以下のステーブルコイン取引に対するキャピタルゲイン税を免除する新たな法案を起草した。

Tether CEO が求人情報を投稿し、モバイル暗号化ウォレットが間もなく登場するという憶測が広がる。

ビットコインマイナーの収益は11%減少し、彼らは投降の危機に直面している。

ブルームバーグのアナリスト：年間流入額が最も多い米国株式ETF上位25銘柄のうち、リターンがマイナスとなっているのはブラックロックIBITのみ。

中国招商銀行：円キャリートレードは持続的に反転し、世界の資産流動性に長期的な下方圧力をかける可能性がある。

Bitmine は、ETH 総供給量の 5% を獲得するという目標の 66% を達成しました。

Nexus Chain × ANT.FUNエコシステムベネフィットイベント開始

毎日の必読

SECの新規制によって加速するETFの成長に伴う隠れたリスク：誰が保管を独占するのか？そして、市場によって最初に清算されるのは誰なのか？

5 つの暗号通貨が市場のトレンドに逆らって急騰しました。次の勝者はどれでしょうか?

2025年、トランプ氏が富を蓄積する年。

2025年の暗号通貨市場における不可逆的な変化

ハッカーが「スナイピング」を始めるとき：2025年のWeb3における10の最も暗い瞬間を振り返る

a16z: 2026年に向けた主要なビジョン：パート2

人気のアクティビティ

RaveDAO at Terra Solis by Tomorrowland: A Female-Led Techno Night Where Web3 Culture Converges

人気のタグ

共有