小狮博客
联系我们
联系我们
当前位置:
小狮博客
>
技术专栏
>
正文
为了改一行代码,我花了10多天时间,让性能提升了40多倍—Pascal架构GPU在vllm下的模型推理优化
2025-01-13
分类:
技术专栏
阅读(189)
评论(0)
家里有张Pascal架构的显卡【划重点,后面要考】,最近发现本地大模型的性能在蹭蹭往上涨,于是开始研究下是否能在本地跑大模型。
赞(
0
)
未经允许不得转载:
小狮博客
»
为了改一行代码,我花了10多天时间,让性能提升了40多倍—Pascal架构GPU在vllm下的模型推理优化
分享到:
更多
(
0
)
上一篇
基于 .NET 的 Nuget 发版工具
下一篇
解密prompt系列44. RAG探索模式?深度思考模式?
相关推荐
货拉拉开源两款三方库,为鸿蒙应用高效开发贡献力量
夜莺监控新版表格配置图文讲解
每周读书与学习->认识性能测试工具JMeter
使用VHF框架实现一个虚拟HID键盘
斜率优化 DP 解析([HNOI2008] 玩具装箱 题解)
GEE&Python-demo1:利用Sentinel-2监测北京奥林匹克森林公园2024年NDVI变化(附Python版)
美团也出招了,LongCat-Flash 开源,主打一个快!
高颜值测试报告 pytest-xhtml
联系我们
回顶
回顶部