
根据Kuai Technology 5月7日,Deepeek感谢技术腾讯团队为“大速度”代码做出了贡献。根据SINA的说法,技术腾腾团队已深入优化了DEEPP沟通的开放框架,以便在各种网络环境中实现大量的性能改进。试验后,在ROCE网络环境中, - 准备好的沟通框架的性能提高了100%,在IB网络环境中提高了30%,为企业提供了更好的解决方案,以进行AI大型模型培训。该技术解决方案已获得DeepSeek的公众认可,称这是“大加速”代码贡献。据了解,由于Deviceek在今年2月开设了包括Deepp在内的五个基本代码库以来,该团队向业界展示了有限的硬件资源以实现Wanka Cluster附近的性能。在这些技术中,DEEPP通过成功方法提高了300%的沟通效率并成功解决了NVIDIA NCCL的MOE架构大型模型问题。但是,技术在ROCE网络环境中的性能不佳,成本较低和应用程序更广泛,将其应用限制在更广泛的方案中。这一疾病已经能够抵抗开放社区资源的持续讨论。据报道,在DEEPP是开放资源之后,腾讯Xingmai网络团队进行了技术研究,并发现了两个主要的瓶颈:一种是双端口网络卡的带宽不足,另一个是Pagka在CPU控制平面的接触中延迟Pagka延迟。在Tencent的技术存在下,它不仅使ROCE网络的性能翻了一番,而且在回到IB(Infiniband)网络时,其原始沟通效率又增加了30%。目前,该技术是完全开放的资源,并已成功地应用于了解诸如Tencent Hunyuan Big Model等项目的培训。在腾讯Xingmai和H20服务器构建的高性能环境中,该解决方案显示出极好的可用性。 [本文的结尾]如果您需要打印,请确保指示来源:Kuai技术编辑:Chaohui