本文总结了矩阵导数的本质定义,对矩阵求导链式法则公式进行了讨论,并使用矩阵求导链式法则公式推导了矩阵乘法的反向传播公式。
从零开始实现简易版Netty(七) MyNetty 实现Normal规格的池化内存分配
在上一篇博客中我们提到,Netty的ByteBuf容器相比jdk的ByteBuffer的最大的一个优势就是实现了池化功能。通过对ByteBuf容器的池化,大幅提高了需要大量创建并回收ByteBuf容器的场景下的性能。
在Netty中对于ByteBuf的池化分为两部分,一个是
ByteBuf对象本身的池化,另一个则是
对ByteBuf背后底层数组所使用内存的池化。
对于ByteBuf对象的池化,Netty中实现了一个简单的对象池(Recycler类)以支持并发的对象创建与回收,相对简单。而对ByteBuf底层数组使用内存的池化设计则很大程度上参考了jemalloc这一适用于多处理器操作系统内核的内存分配器。
关于jemalloc的工作原理,官方有两篇经典论文,分别是写于2006年的
A Scalable Concurrent malloc(3) Implementation for FreeBSD与2011年的
scalable-memory-allocation-using-jemalloc。
其中2011年的论文中提到,相比起2006年最初版本的jemalloc,新版本的jemalloc做了进一步的优化,大幅提升了jemalloc的性能与易用性。强烈建议读者在开始着手研究Netty池化内存的工作原理细节之前,先阅读这两篇高屋建瓴的关于jemalloc的论文。掌握了核心的设计理念后,再去看细节能起到事半功倍的作用。
在后续介绍Netty的实现细节时,我也会结合这两篇论文中的内容来进行讲解,个人认为背后的设计理念与实现的细节同样重要,应该争取做到知其然而知其所以然。
【URP】Unity超分辨率优化实践
动态分辨率的核心是给画面加个”弹性开关”,根据设备性能自动调整渲染分辨率,在GPU负载高时降低分辨率以保持帧率稳定。URP通过缩小渲染目标(如颜色缓冲、深度缓冲)的分辨率减少GPU计算量,最后再将画面放大到屏幕分辨率
漏洞解析–SSRF 从小白到透彻,一篇就够!
SSRF存在的条件如下
PHP 性能优化实战 OPcache + FPM 极限优化配置
这事一直没有优先级,所以我从来没处理过——直到现在。
【译】Visual Studio 八月更新已发布 —— 更智能的人工智能、更出色的调试功能以及更多控制权

鸿蒙应用开发从入门到实战(二):DevEco Studio工具安装
聚焦结构化注意力,探索提升多模态大模型文档问答性能
记一次 .NET 某企业ECM内容管理系统 内存暴涨分析
由于是在 linux 上采摘下来的dump,所以用
!maddress -summary 命令观察进程的内存布局,输出如下:
【Win11 启动项BCD文件修复教程】
首先重新开启按F11,进入恢复模式,然后选择命令提示符模式。
小狮博客