当前位置：小狮博客 > 技术专栏 > 正文

KV Cache 与 MQA/GQA：从推理优化看注意力机制的工程化演进

2025-12-01 分类：技术专栏阅读(130) 评论(0)

在 Transformer 的自注意力机制中，第
\(t\) 个位置的输出需要与历史所有位置进行交互：

赞(0)

未经允许不得转载：小狮博客 » KV Cache 与 MQA/GQA：从推理优化看注意力机制的工程化演进

相关推荐

回顶
回顶部