DeepSeek オープンソース ウィークの 2 日目には、MoE モデルのトレーニングと推論のための最初のオープンソース EP 通信ライブラリである DeepEP をご紹介します。 効率的で最適化された全対全通信、NVLink および RDMA によるノード内およびノード間のサポート、トレーニングと推論用の事前設定された高スループットカーネル、推論デコード用の低レイテンシカーネル、ネイティブ FP8 スケジューリングにより、計算と通信の重複に対する柔軟な GPU リソース制御をサポート
DeepSeek オープンソース ウィークの 2 日目には、MoE モデルのトレーニングと推論のための最初のオープンソース EP 通信ライブラリである DeepEP をご紹介します。 効率的で最適化された全対全通信、NVLink および RDMA によるノード内およびノード間のサポート、トレーニングと推論用の事前設定された高スループットカーネル、推論デコード用の低レイテンシカーネル、ネイティブ FP8 スケジューリングにより、計算と通信の重複に対する柔軟な GPU リソース制御をサポート
全てのコメント