LangChain RAG 学习笔记:从文档加载到问答服务

thbcm阅读(96)

首先回忆一下RAG 系统的核心思想,是将用户查询与知识库中的相关信息进行匹配,再结合大语言模型生成准确回答。

这里我将一套 RAG 系统通分成以下几个模块:

面向智能体与大语言模型的 AI 基础设施:选项、工具与优化

thbcm阅读(86)

无论采用云、本地还是混合云部署,基础设施在 AI 架构落地过程中都起着关键作用。本文是 AI 基础设施系列文章的一部分,聚焦于部署和优化 AI 智能体与大语言模型的多样化基础设施选择,深入剖析了基础设施在 AI 架构(尤其是推理环节)实现中的核心价值。我们将详细介绍包括开源解决方案在内的各类工具,通过图表展示推理流程,并强调高效、可扩展 AI 部署的关键考量因素。

如何区分应用所在的运行环境:物理机、虚拟机、容器还是 K8s?

thbcm阅读(92)

物理机和虚拟机因为都是完整的操作系统。因此可以用dmidecode来检查计算机所在的环境。dmidecode是一个可以将DMI table中的内容以人类可读格式导出的工具。DMI (也被称为
SMBIOS) Table中保存的是该表包含系统硬件组件的描述,以及其他有用的信息,例如序列号和BIOS版本。

【模板】扩展中国剩余定理(EXCRT)

thbcm阅读(92)

有物不知其数,三三数之剩二,五五数之剩三,七七数之剩二。问物几何?即,一个整数除以三余二,除以五余三,除以七余二,求这个整数。《孙子算经》中首次提到了同余方程组问题,以及以上具体问题的解法,因此在中文数学文献中也会将中国剩余定理称为孙子定理。

联系我们