探索在大模型训练中使用 Megatron-Core 训练框架提高显存使用效率
前言 在大模型训练中,显存(GPU Memory)始终是最稀缺的资源之一。随着模型规模迈入百亿、千亿甚至万亿参 … Continued
阅读开发者创建的最新技术信息、头条新闻 和内容。
前言 在大模型训练中,显存(GPU Memory)始终是最稀缺的资源之一。随着模型规模迈入百亿、千亿甚至万亿参 … Continued
物理在机器人仿真中发挥着至关重要的作用,它为机器人在真实环境中的行为及交互提供了精准的虚拟呈现基础。借助仿真器 … Continued
在之前关于 AI 在制造和运营中应用的博文中,我们探讨了供应链所面临的独特数据挑战,并介绍了智能特征工程如何显 … Continued
生成式 AI 为分析现有视频流开辟了全新可能。视频分析正从统计物体演进为将原始视频片段转化为实时理解,从而提供 … Continued
尽管当今的机器人在受控环境中表现出色,但在应对现实世界任务所需的不可预测性、灵活性和细微交互方面仍面临挑战,例 … Continued
通过利用大语言模型和语音模型,生成式 AI 正在创建智能 3D 虚拟形象,使用户能够在从视频游戏到客户服务等场 … Continued
与基于 LLM 的传统系统受限于其训练数据不同,检索增强生成 (RAG) 通过整合相关的外部信息来提升文本生成 … Continued
无论是制药、化学还是材料应用,分子设计中反复出现的挑战在于构建可合成的分子。合成性评估通常需要绘制分子的合成路 … Continued
构建可靠的视觉检测流程以实现缺陷检测和质量控制并非易事。制造商和开发者常常面临诸多挑战,例如针对特定领域定制通 … Continued
社区检测算法通过识别网络中隐藏的关联实体组,在理解数据方面发挥着重要作用。社交网络分析、推荐系统、GraphR … Continued
在之前关于 FP8 训练的博文中,我们探讨了 FP8 精度的基础知识 并深入分析了适用于大规模深度学习的 多种 … Continued
如今,Microsoft 正在向开发者提供 Windows ML。借助 Windows ML,C#、C++ 和 … Continued
TensorRT-LLM 在 NVIDIA Blackwell GPU 上创下了 DeepSeek-R1 推理 … Continued
DeepSeek-V3 / R1 等模型采用大规模细粒度混合专家模型 (MoE) 架构,大幅提升了开源模型的质 … Continued
NVIDIA 的科学家与劳伦斯伯克利国家实验室(伯克利实验室)合作,推出了一款名为 Huge Ensemble … Continued
阅读开发者创建的最新技术信息、头条新闻 和内容。
前言 在大模型训练中,显存(GPU Memory)始终是最稀缺的资源之一。随着模型规模迈入百亿、千亿甚至万亿参 … Continued
物理在机器人仿真中发挥着至关重要的作用,它为机器人在真实环境中的行为及交互提供了精准的虚拟呈现基础。借助仿真器 … Continued
在之前关于 AI 在制造和运营中应用的博文中,我们探讨了供应链所面临的独特数据挑战,并介绍了智能特征工程如何显 … Continued
生成式 AI 为分析现有视频流开辟了全新可能。视频分析正从统计物体演进为将原始视频片段转化为实时理解,从而提供 … Continued
尽管当今的机器人在受控环境中表现出色,但在应对现实世界任务所需的不可预测性、灵活性和细微交互方面仍面临挑战,例 … Continued
通过利用大语言模型和语音模型,生成式 AI 正在创建智能 3D 虚拟形象,使用户能够在从视频游戏到客户服务等场 … Continued
与基于 LLM 的传统系统受限于其训练数据不同,检索增强生成 (RAG) 通过整合相关的外部信息来提升文本生成 … Continued
无论是制药、化学还是材料应用,分子设计中反复出现的挑战在于构建可合成的分子。合成性评估通常需要绘制分子的合成路 … Continued
构建可靠的视觉检测流程以实现缺陷检测和质量控制并非易事。制造商和开发者常常面临诸多挑战,例如针对特定领域定制通 … Continued
社区检测算法通过识别网络中隐藏的关联实体组,在理解数据方面发挥着重要作用。社交网络分析、推荐系统、GraphR … Continued
在之前关于 FP8 训练的博文中,我们探讨了 FP8 精度的基础知识 并深入分析了适用于大规模深度学习的 多种 … Continued
如今,Microsoft 正在向开发者提供 Windows ML。借助 Windows ML,C#、C++ 和 … Continued
TensorRT-LLM 在 NVIDIA Blackwell GPU 上创下了 DeepSeek-R1 推理 … Continued
DeepSeek-V3 / R1 等模型采用大规模细粒度混合专家模型 (MoE) 架构,大幅提升了开源模型的质 … Continued
NVIDIA 的科学家与劳伦斯伯克利国家实验室(伯克利实验室)合作,推出了一款名为 Huge Ensemble … Continued