DeepSeek-V3.2-Expモデルが正式にリリースされ、オープンソース化されました。このモデルはスパースアテンションアーキテクチャを採用しており、コンピューティングリソースの消費を効果的に削減し、モデル推論の効率を向上させます。このモデルは現在、Huawei CloudのMaaSプラットフォームで利用可能です。Huawei Cloudは、大規模EP並列化ソリューションを用いてDeepSeek-V3.2-Expモデルの展開を継続しています。この戦略は、スパースアテンション構造を活用し、長いシーケンスの類似性を実現するコンテキスト並列戦略を実装しながら、モデルのレイテンシとスループット性能のバランスを実現します。
全てのコメント