
Andrej Karpathy 评 DeepSeek-OCR 论文:图像输入可能成为大语言模型新方向
2025年10月21日 14:57
综合新闻
特斯拉前自动驾驶负责人、OpenAI联合创始人Andrej Karpathy近日在推特上评论了开源的DeepSeek-OCR论文,提出了一个颇具启发性的观点:相比传统文本输入,图像作为大语言模型(LLM)的输入形式可能更加高效。这一观点在AI研究社区引发了关于模型输入方式未来演进方向的讨论。 Karpathy认为,当前广泛使用的文本token输入方...