首先回忆一下RAG 系统的核心思想,是将用户查询与知识库中的相关信息进行匹配,再结合大语言模型生成准确回答。
这里我将一套 RAG 系统通分成以下几个模块:
面向智能体与大语言模型的 AI 基础设施:选项、工具与优化
无论采用云、本地还是混合云部署,基础设施在 AI 架构落地过程中都起着关键作用。本文是 AI 基础设施系列文章的一部分,聚焦于部署和优化 AI 智能体与大语言模型的多样化基础设施选择,深入剖析了基础设施在 AI 架构(尤其是推理环节)实现中的核心价值。我们将详细介绍包括开源解决方案在内的各类工具,通过图表展示推理流程,并强调高效、可扩展 AI 部署的关键考量因素。
吴恩达深度学习课程二: 改善深层神经网络 第一周:深度学习的实践(二)L2正则化
【大数据高并发核心场景实战】 数据持久化层 – 查询分离
基本思路:将更新的数据放在主数据库里,而查询的数据放在另外一个专门针对搜索的存储系统里。主库单表查询,无关联无外键,所以写数据无压力。数据查询通过一个专门处理大数据量的查询引擎来解决。
如何区分应用所在的运行环境:物理机、虚拟机、容器还是 K8s?
物理机和虚拟机因为都是完整的操作系统。因此可以用dmidecode来检查计算机所在的环境。dmidecode是一个可以将DMI table中的内容以人类可读格式导出的工具。DMI (也被称为
SMBIOS) Table中保存的是该表包含系统硬件组件的描述,以及其他有用的信息,例如序列号和BIOS版本。
Git 免密认证:Git Credential Helper
比如你没有提交 SSH 公钥的权限。
【模板】扩展中国剩余定理(EXCRT)
有物不知其数,三三数之剩二,五五数之剩三,七七数之剩二。问物几何?即,一个整数除以三余二,除以五余三,除以七余二,求这个整数。《孙子算经》中首次提到了同余方程组问题,以及以上具体问题的解法,因此在中文数学文献中也会将中国剩余定理称为孙子定理。
《刚刚问世》系列初窥篇-Java+Playwright自动化测试-30- 操作单选和多选按钮 – 番外篇(详细教程)
https://www.jq22.com/ 这个是宏哥又找到的一个网站,不错的,有源码。进入后可以搜索你要演示的demo。
用过上百款编程MCP,只有这15个真正好用,Claude Code与Codex配置MCP详细教程
我试用过上百款编程类的MCP工具,只有这15个是真正好用的。这些MCP可以为AI编程工具赋予云端数据库、操作浏览器、读取设计稿生成网页、产品配图、安全扫描、全自动部署等等的能力。许多人说MCP是一个开发者比用户还多的技术,其实很多好用的MCP工具主要集中在编程领域。本期视频,我准备使用最近热度最高的两个AI编程工具——Claude Code还有Codex,来实战演示一下这些MCP Server。我还准备了许多具体案例,来看看我们如何利用MCP,让生产力翻倍。MCP也就是模型上下文协议,简单一句话总结,MCP就是AI的标准化工具箱,AI可以使用这个工具箱,与外部系统对话,代替人类完成一些操作。
我们要介绍的第一个,就是让AI有能力操作浏览器的工具箱。
痞子衡嵌入式:在i.MXRTxxx下使能DMA链式传输可达到SPI从设备接收速率上限50Mbps
最近痞子衡在帮一个 RT600 的 AR 眼镜客户优化 SPI 从设备接收数据的速率,我们知道 SPI 从设备接收数据方法一般有三种:1) 轮询模式,2) 中断模式,3) DMA 模式。前两种模式都会受到 CPU 性能的限制,而 DMA 模式则可以最大程度地降低 CPU 负载,提高数据传输效率以及速率。
小狮博客