懂数据抓取的人,真的赢在起跑线了!

thbcm阅读(122)

上周和朋友吃饭,他突然拍着桌子说:“我最近学了一门数据技能,简直是职场里的‘降维打击’!”一开始我还以为他在吹牛,但他打开手机给我看了一段演示:用一个叫 Firecrawl 的工具,几秒钟就从一个电商网站上抓取了大量商品数据!那一刻,我彻底被震撼了。

说实话,我对数据抓取这种东西,最初只有模糊的印象。不就是把网页上的信息复制粘贴下来吗?但真正了解后我才发现,原来数据抓取可以这么厉害,不仅能帮我们快速获取信息,还能在分析客户、优化产品等方面发挥巨大作用。

为了深挖这个技能的潜力,我尝试去了解 Firecrawl 的用法。一开始我天真地以为,这种工具肯定操作复杂、门槛高,没想到它竟然简单到出乎意料。这个工具的课程,把零基础的人也照顾得很好,第一章就讲了从基础操作到本地部署的全过程。哪怕是像我这样对代码一窍不通的人,也可以轻松上手。

更让我惊喜的是,这门课程还让我学到了如何用 LLM(大语言模型) 提取数据,比如从电商页面抓取商品评价,或者从行业报告中提取关键洞察。通过结合 E2B(端到端数据),还能进一步分析数据,挖掘隐藏的商业趋势。想象一下,当我能用这些数据为公司制定更精准的营销策略时,我的职场竞争力会提升多少! 学完这些后,我忍不住用 Groq Llama 3 构建了一个自己的“知识库”。这就好比给自己的大脑装上了“外挂”,把抓取到的数据集中存储、分类,随时调用。用它来分析客户需求、写市场报告,效率简直翻倍!

如果你也想玩转数据抓取,找到属于自己的职场加速器,不妨去看看这个课程。它会从零基础开始手把手教你,还会分享很多企业都在用的 AI 数据策略和实战案例。难怪有人说,懂数据抓取的人,真的赢在了起跑线。

最后,我想问你一个问题:如果给你一个工具,能在职场中赢得更多机会,你愿意花点时间去尝试吗?点击下面链接,开启你的数据技能之旅吧!

Firecrawl 将任何网站转为LLM就绪数据

PC应用软件版本怎么选,如何查看自己的电脑系统适合下载哪个安装包

thbcm阅读(130)

编程狮学习的过程中,安装合适的软件版本是至关重要的一步。无论是安装编程环境(如 PythonJava_blabk 等),还是开发工具(如 VS CodePyCharm 等),选择正确的软件版本可以避免很多兼容性问题。然而,小狮妹收到过众多同学发来的求助,在面对琳琅满目的软件版本和操作系统架构时,许多同学会感到困惑:我该如何选择适合自己电脑的软件版本?今天,小狮妹就手把手教你如何查看电脑系统信息,并选择合适的软件安装包。

一、了解您的操作系统和架构

在下载软件之前,您需要了解自己电脑的操作系统和架构类型。这通常包括操作系统的类型(如 Windows、macOS、Linux 等)和架构(如 x86、x64、ARM 等)。

操作系统及架构类型说明

了解操作系统及架构类型能帮助您更准确地识别和下载适合您系统的软件版本:

操作系统 架构类型 软件后缀(常见) 说明
macOS Apple Silicon .dmg 或 .pkg 适用于搭载 Apple M 系列芯片的 Mac 电脑,性能更优,能效更高。
Intel .dmg 或 .pkg 适用于搭载 Intel 芯片的 Mac 电脑,兼容性较好,支持更多旧软件。
Windows x64 .exe 或 .msi 64 位 Windows 操作系统,支持更多内存和更高性能。
x86 .exe 或 .msi 32 位 Windows 操作系统,适用于较旧的硬件或特定需求。
Android ARM .apk 适用于 Android 设备的 ARM 架构,性能和能效平衡。
x86 .apk 适用于 Android 设备的 x86 架构,兼容性较好。
iOS ARM .ipa 适用于 iOS 设备的 ARM 架构,优化了性能和能效。
HarmonyOS ARM .hap 适用于 HarmonyOS 设备的 ARM 架构,支持华为生态系统。
Linux x86 .tar.gz 或 .deb 64 位 x86 架构,适用于大多数现代 Linux 发行版。
ARM64 .tar.gz 或 .rpm 64 位 ARM 架构,适用于 ARM 处理器,如 AWS Graviton2。

软件后缀说明

  • .dmg: macOS 磁盘映像文件,通常用于安装应用程序。
  • .pkg: macOS 安装包文件,包含安装所需的所有文件。
  • .exe: Windows 可执行文件,用于启动安装程序或运行程序。
  • .msi: Windows 安装包文件,基于 Windows Installer 的安装包。
  • .apk: Android 应用程序包文件,用于安装 Android 应用程序。
  • .ipa: iOS 应用程序包文件,用于安装 iOS 应用程序。
  • .hap: HarmonyOS 应用程序包文件,用于安装 HarmonyOS 应用程序。
  • .tar.gz: Linux 压缩包文件,通常包含软件的源代码或二进制文件。
  • .deb: Debian 软件包文件,用于在基于 Debian 的 Linux 发行版上安装软件。
  • .rpm: Red Hat 软件包文件,用于在基于 Red Hat 的 Linux 发行版上安装软件。

了解这些软件后缀可以帮助您在下载软件时快速识别文件类型,确保下载的文件与您的操作系统和架构兼容。

二、软件版本的选择

软件版本通常根据其功能、稳定性和目标用户群体进行区分。了解不同版本的软件可以帮助您选择最适合您需求的版本。

软件版本说明

英文版本名称 中文翻译 说明 常见后缀 备注
Community Edition 社区版 通常是免费提供给用户的版本,包含基本功能,适合个人使用或小团队。 .dmg, .exe, .msi
Professional Edition 专业版 提供比社区版更多的功能,适合专业开发者或企业用户,可能需要付费。 .dmg, .exe, .msi 可能包含高级功能和技术支持。
Enterprise Edition 企业版 为企业级用户设计,包含高级功能,如安全性增强、性能优化等,通常需要付费。 .dmg, .exe, .msi 通常包括大规模部署和管理工具。
Flagship Edition 旗舰版 类似于企业版,提供最全面的功能和最优的性能,通常定位于高端市场。 .dmg, .exe, .msi 可能包含所有高级功能和优先技术支持。
Free Edition 免费版 功能有限的免费版本,通常用于吸引用户试用,可能会包含广告或限制某些高级功能。 .dmg, .exe, .msi 适合预算有限的用户。
Standard Edition 标准版 提供核心功能,适合一般用户,价格适中。 .dmg, .exe, .msi 适合大多数用户的基本需求。
Premium Edition 高级版 在标准版的基础上增加一些高级功能,价格相对较高。 .dmg, .exe, .msi 适合需要额外功能的用户。
Educational Edition 教育版 专为学生和教育工作者设计,可能包含特殊的教育工具和资源,价格优惠或免费。 .dmg, .exe, .msi 通常需要教育资格验证。
Developer Edition 开发者版 为开发者提供额外的工具和资源,支持开发和测试,可能包含专业版的所有功能。 .dmg, .exe, .msi 适合开发者和测试人员。
Open Source Edition 开源版 源代码公开,用户可以自由修改和分发,通常遵循特定的开源许可证。 .src, .tar.gz 适合技术爱好者和开源社区成员。
Trial Edition 试用版 允许用户在一定时间内免费试用软件,功能可能与完整版相同,但有使用期限。 .dmg, .exe, .msi 适合在购买前测试软件功能的用户。
Lite Edition 精简版 功能简化的版本,体积小,占用资源少,适合资源有限的设备。 .dmg, .exe, .msi 适合对功能要求不高的用户。
Personal Edition 个人版 专为个人用户设计,可能包含个人使用所需的特定功能,价格优惠。 .dmg, .exe, .msi 适合个人非商业用途。
Portable Edition 便携版 不需要安装,可以便携式使用,通常放在 USB 设备上。 .exe 或 .zip 适合需要在多台电脑上使用同一软件的用户。
Green Edition 绿色版 通常不包含安装程序,不修改系统设置,易于卸载。 .exe 或 .zip 适合希望避免系统修改的用户。
Beta Edition 测试版 软件的测试版本,可能包含新功能,但也可能存在不稳定因素。 .dmg, .exe, .msi 适合愿意尝试新功能并提供反馈的用户。
Stable Edition 正式版 软件的稳定版本,经过充分测试,推荐大多数用户使用。 .dmg, .exe, .msi 适合寻求稳定性的用户。
Preview Edition 预览版 提供即将发布的新功能的预览,可能不如正式版稳定。 .dmg, .exe, .msi 适合希望提前体验新功能的用户。
Alpha Edition 阿尔法版 软件的早期开发版本,通常用于内部测试,非常不稳定。 .dmg, .exe, .msi 适合开发者和高级用户,用于测试和反馈。

三、如何查看电脑的操作系统和架构

了解您的电脑系统信息是选择正确软件版本的关键。以下是查看不同操作系统信息的方法:

对于Windows用户:

  1. 按下 Win + R 键,输入 msinfo32,然后按回车。
  2. 在系统摘要中,您可以找到操作系统版本和系统类型(64位或32位)。

对于macOS用户:

  1. 点击屏幕左上角的苹果标志,选择“关于本机”。
  2. 在概览标签中,您可以找到您的 macOS 版本和处理器类型( Intel 或 Apple Silicon )。

对于Linux用户:

  1. 打开终端。
  2. 输入 uname -m 来查看架构类型(x86_64为64位,i686为32位)。
  3. 输入 lsb_release -a 来查看Linux发行版和版本。

四、下载和安装软件

一旦您确定了操作系统和架构类型,就可以选择合适的软件版本进行下载和安装了。请确保从官方网站或可信的来源下载软件,以避免安全风险。

五、总结

选择合适的软件版本对于确保软件的兼容性和性能至关重要。通过了解您的操作系统和架构类型,以及不同软件版本的功能和特点,您可以做出更明智的选择。记住,始终从可信的来源下载软件,并考虑使用正版软件以获得最佳体验和支持。

AI 相关核心术语中文翻译规范表

thbcm阅读(136)

在人工智能(AI)的学习中,术语的理解是至关重要的第一步。对于零基础的学习者来说,掌握这些术语不仅可以帮助更好地理解 AI 的概念,还能在未来的编程实践中更加得心应手。编程狮(W3Cschool)作为国内知名的编程学习平台,一直致力于将复杂的技术知识简化,让每一位初学者都能轻松上手。

一、为什么需要规范的中文翻译?

AI 领域的术语众多,且英文术语在不同语境下可能有多种翻译方式。对于初学者来说,不规范的翻译可能导致理解上的混淆。例如,“Agent”一词,有翻译为“智能体”的,也有翻译为“代理”的。为了帮助初学者更好地入门,编程狮整理了一份 AI 核心术语的中文翻译规范表,这份表不仅提供了官方推荐的中文翻译,还结合了国内的学习习惯,确保每个术语都能被准确、通俗地理解。

二、AI 核心术语中文翻译规范表

以下是一些常见的 AI 核心术语及其规范中文翻译,这些术语覆盖了 AI 的多个重要领域,从基础概念到高级应用,帮助初学者构建完整的知识体系。

将 AI 相关核心术语按照不同的功能和应用领域进行分类。以下是分类后的术语表:

1、基础概念类

英文术语 中文翻译 说明
Artificial Intelligence (AI) 人工智能 模拟人类智能的技术
Machine Learning (ML) 机器学习 让机器通过数据学习规律
Deep Learning (DL) 深度学习 使用多层神经网络进行学习
Neural Network (NN) 神经网络 模拟人脑神经元的计算模型
Supervised Learning 监督学习 使用标记数据进行学习
Unsupervised Learning 无监督学习 不使用标记数据进行学习
Reinforcement Learning (RL) 强化学习 通过奖励机制学习最优行为
Transfer Learning 迁移学习 将已训练模型应用于新任务
Fine-tuning 精调 对预训练模型进行微调以适应特定任务

2、模型与算法类

英文术语 中文翻译 说明
Convolutional Neural Network (CNN) 卷积神经网络 用于图像处理的神经网络
Recurrent Neural Network (RNN) 循环神经网络 用于处理序列数据的神经网络
Long Short-Term Memory (LSTM) 长短期记忆网络 一种特殊的 RNN,用于处理长期依赖
Gated Recurrent Unit (GRU) 门控循环单元 一种简化的 RNN 模型
Transformer 变换器 基于注意力机制的模型架构
Generative Adversarial Network (GAN) 生成对抗网络 由生成器和判别器组成的模型
Support Vector Machine (SVM) 支持向量机 一种用于分类和回归的模型
Principal Component Analysis (PCA) 主成分分析 用于降维的统计方法
t-Distributed Stochastic Neighbor Embedding (t-SNE) t 分布随机近邻嵌入 用于高维数据可视化
Backpropagation 反向传播 计算神经网络梯度的方法
Gradient Descent 梯度下降 优化算法,用于最小化损失函数
Dropout 随机失活 防止过拟合的技术
Batch Normalization 批量归一化 用于加速训练和提高模型稳定性的技术
Cross-Validation 交叉验证 评估模型性能的方法
Hyperparameter 超参数 模型训练前需要设置的参数
Loss Function 损失函数 衡量模型预测与真实值差异的函数
Precision 精确率 正确预测为正的样本占预测为正的样本的比例
Recall 召回率 正确预测为正的样本占实际为正的样本的比例
F1 Score F1 值 精确率和召回率的调和平均值
ROC Curve ROC 曲线 衡量模型分类性能的曲线
AUC 曲线下面积 ROC 曲线下的面积,衡量模型性能的指标

3、数据处理类

英文术语 中文翻译 说明
Data Augmentation 数据增强 通过变换数据增加数据多样性
Feature 特征 描述数据的属性
Label 标签 数据的类别或目标值
Token 词元 文本数据中的最小单位
Embedding 嵌入 将数据转换为向量表示
Vector 向量 一维数组,用于表示数据
Matrix 矩阵 二维数组,用于表示数据
Tensor 张量 多维数组,用于表示数据
Normalization 归一化 将数据缩放到特定范围
Standardization 标准化 将数据转换为均值为 0,标准差为 1 的分布

4、应用领域类

英文术语 中文翻译 说明
Natural Language Processing (NLP) 自然语言处理 让机器理解和生成人类语言
Computer Vision (CV) 计算机视觉 让机器“看”和理解图像
Speech Recognition (ASR) 自动语音识别 将语音转换为文本的技术
Text-to-Speech (TTS) 文本转语音 将文本转换为语音的技术
Optical Character Recognition (OCR) 光学字符识别 将图像中的文字转换为文本的技术
Named Entity Recognition (NER) 命名实体识别 从文本中提取命名实体的任务
Chatbot 聊天机器人 与用户进行对话的程序
AIGC AI 生成内容 使用 AI 生成文本、图像等
AGI 通用人工智能 具有广泛智能的 AI 系统

5、硬件与计算类

英文术语 中文翻译 说明
GPU 图形处理单元 用于加速计算的硬件
TPU 张量处理单元 专门用于 AI 计算的硬件
FPGA 现场可编程门阵列 可编程的硬件,用于定制计算
ASIC 专用集成电路 为特定任务设计的硬件
Edge Computing 边缘计算 在网络边缘进行计算的技术
Federated Learning 联邦学习 在分布式数据上进行学习的技术
Cloud AI 云 AI 基于云计算的 AI 服务
MLOps 机器学习运维 机器学习的开发和运维流程

6、性能评估类

英文术语 中文翻译 说明
BLEU BLEU 值 用于评估机器翻译质量的指标
Perplexity 困惑度 衡量模型预测不确定性的指标
Epoch 轮次 训练过程中数据集被完整遍历的次数
Learning Rate 学习率 控制模型更新步长的参数
Overfitting 过拟合 模型对训练数据过度拟合,泛化能力差
Underfitting 欠拟合 模型未能学习到数据的基本规律
Model Compression 模型压缩 减小模型大小的技术
Quantization 量化 将浮点数转换为低精度数的技术
Pruning 剪枝 删除模型中不重要的部分以减小模型大小
Knowledge Distillation 知识蒸馏 将大模型的知识迁移到小模型的技术

7、其他

英文术语 中文翻译 说明
API 应用程序接口 不同程序之间交互的接口
SDK 软件开发包 开发软件时使用的工具集
Benchmark 基准测试 用于评估模型性能的标准测试
Ground Truth 真值 数据的真实标签
Pipeline 流水线 数据处理的流程
Latent Space 隐空间 数据的潜在表示空间

三、总结

掌握 AI 核心术语的中文翻译是学习 AI 的重要一步。编程狮整理的这份术语表,旨在帮助零基础的学习者快速入门。通过规范的中文翻译和通俗易懂的解释,初学者可以更好地理解 AI 的概念和应用。同时,编程狮提供的学习资源和实战项目,将进一步助力学习者在 AI 领域的成长。

希望每一位初学者都能在编程狮的帮助下,轻松开启 AI 学习之旅。

2025年11月TIOBE编程语言排行榜发布:C#有望首次超越Java,Python持续引领潮流!

thbcm阅读(128)

温馨提示:本文所有数据均来自 TIOBE 官网 2025-11 月榜,由编程狮技术团队翻译、注释并给出中文学习建议,转载请保留来源。

一、本月大新闻

  1. C# 持续攀升:C# 市场份额环比增长 2.67%,达到 7.65%,与 Java 仅有不到 1% 的差距,有望首次超越 Java。
  2. Python 稳居第一:Python 市场份额达 23.37%,较上月微涨 0.52%,持续保持 TIOBE 指数第一,且有望连续三年获得“年度编程语言”称号。

二、2025年11月TOP 20速览表

排名 语言 占比 环比 编程狮一句话科普
1 Python 23.37% +0.52% 新手村神器,语法简洁易懂,适合零基础入门。
2 C 语言 9.68% +0.67% 底层老大哥,学硬件先过它。
3 C ++ 8.95% -1.69% 游戏/嵌入式/高性能计算必学。
4 Java 8.54% -1.06% 大厂后端、Android主流。
5 C# 7.65% +2.67% 微软全家桶+Unity游戏脚本,来势汹汹。
6 JavaScript 3.42% -0.29% 前端灵魂,网页动起来就靠它。
7 Visual Basic 3.31% +1.36% 老旧系统维护,.NET入门可选。
8 Delphi 2.06% +0.58% 国内工控、ERP老项目仍在用。
9 Perl 1.84% +1.16% 文本处理老神器,运维脚本复活。
10 SQL 1.80% -0.14% 操作数据库的“普通话”。
11 Go 语言 1.72% -0.63% 云原生高并发,Docker/K8s同源。
12 R 语言 1.67% +0.65% 数据分析、统计建模常用。
13 Fortran 1.55% -0.42% 科学计算上古神兽,气象/航天在用。
14 Rust  1.39% +0.21% 内存安全+高性能,系统级新贵。
15 MATLAB 1.38% +0.11% 高校科研、算法仿真常用。
16 PHP 1.31% -0.16% 网站后台老江湖,WordPress核心。
17 Ada  1.23% +0.52% 军工、航天高可靠系统指定语言。
18 汇编语言(Assembly language) 1.16% +0.20% 最接近0和1的人类语言,底层调试必备。
19 Scratch 1.02% -0.09% 拖拽式少儿编程,培养逻辑思维。
20 Kotlin  0.98% +0.06% Android官方新宠,语法比Java简洁。

三、C#为何强势崛起?

TIOBE 分析指出三大原因:

  1. 跨平台支持:C# 现已支持所有主流操作系统,不再局限于 Windows。
  2. 开源+新特性:微软将 C# 开源并持续加入开发者想要的新特性。
  3. 领域全开:除金融外,游戏、云端、桌面应用等领域C#与 Java 平分秋色。

编程狮建议:
– 如果你是大厂后端/Android 开发者,Java 仍是最优选择。
– 如果你是游戏开发者/Windows 生态用户,C# 是不二之选。
– 想体验 C#?编程狮在线IDE已预装.NET环境,点击即可运行,零安装!

四、零基础选路指南(附编程狮学习路径)

目标 推荐语言 编程狮路径 预计时间
自动化办公、爬虫、AI Python Python零基础到高薪就业 4周
网页交互效果 JavaScript 前端开发:零基础入门到项目实战 5周
大厂后端/Android Java JAVA架构师从零开始学全套课程 8周
游戏/系统/高性能 C++ C/C++零基础入门(合集) 10周
云原生微服务 Go Go并发与Docker实战 6周

Config.Msi是什么文件夹?可以删除吗?一文搞懂这个”神秘”的Windows文件夹

thbcm阅读(134)

很多初学者在使用电脑时,会发现C盘根目录下突然冒出一个名为 Config.Msi 的隐藏文件夹,里面还存着一堆 .rbf.rbs 之类的奇怪文件。就像家里装修完后,院子里还留着施工队的临时工棚——占地方又不知道能不能拆。今天,编程狮就带你彻底搞懂这个文件夹的来龙去脉,让你像专业程序员一样从容处理!

一、Config.Msi 文件夹到底是什么?

Config.Msi 文件夹是微软安装程序(Microsoft Installer,简称 MSI)自动生成的临时”工作间”。当你安装 Office、SQL Server、Visual Studio 等大型软件时,Windows 需要一处地方来记录”施工日志”和”备份材料”,防止安装失败时系统回不到原来的状态。系统会在这里:

  1. 记录安装日志 – 像写日记一样,详细记录每一步操作
  2. 备份旧文件 – 把可能被覆盖的系统文件提前备份,防止安装失败导致系统崩溃
  3. 保存回滚脚本 – 如果安装中途出错,能自动”时光倒流”,恢复系统到安装前的状态

通俗解释:Windows 的”安装时光机”

编程狮小贴士:MSI 是 Windows 的标准安装格式,就像安卓的 APK 安装包一样,是微软官方的安装解决方案。

二、文件夹里到底装了啥?能看懂吗?

Config.Msi 通常藏在 C 盘根目录C:\Windows\Installer下,是个隐藏文件夹。打开后你会看到几类文件:

文件类型 通俗解释 文件扩展名 作用
回滚脚本 “后悔药”配方 .rbs.rbf 记录安装前系统状态,用于失败时恢复
日志文件 安装”监控录像” .log.txt 记录安装时间、路径、错误信息
临时文件 施工”脚手架” .tmp 安装过程中的临时缓存数据

这些文件在安装成功后会自动清理,但有时会因为权限问题或程序 bug “赖着不走”。

三、重点来了:到底能不能删?

答案是:能,但要分情况! 就像整理房间,没用了的快递盒可以扔,但房产证可不能丢。

可以安全删除的情况

  1. 所有软件都安装完毕超过3个月 – 确认最近没有正在进行的安装/卸载操作
  2. 文件夹很大(超过1GB) – 说明里面有大量”僵尸文件,严重影响C盘空间”
  3. 软件运行正常 – 想清理的垃圾文件,且对应程序已能正常使用

千万别删的情况

  1. 正在安装软件时 – 删了等于拆脚手架,会直接导致安装失败
  2. 某些专业软件需要修复 – 比如AutoCAD、Visual Studio等,删了可能无法修复或卸载
  3. 系统提示权限不足 – 说明文件还在被占用,强制删除可能引发问题

不同场景下的处理建议

场景A:新手用户(推荐保守方案) “我刚学编程,C 盘只剩 2GB 空间了,看着 Config.Msi 有 1GB 大,能删吗?”

编程狮建议:别直接删!先用 Windows 自带的”磁盘清理”工具,这是最安全的做法。就像不会拆墙就先别动承重结构一样。

场景B:进阶用户(可选择性清理) “我用编程狮的教程学了半年 Python,现在 C 盘空间紧张,想手动清理”

编程狮建议:可以手动删除,但务必先备份!重要的话说三遍:备份!备份!备份!

四、3 种安全清理方法

方法一:使用 Windows 自带工具(最安全,推荐新手)

# 打开磁盘清理工具(就像请个专业保洁)
1. 右键点击 C 盘 → 属性 → 磁盘清理
2. 点击"清理系统文件"
3. 勾选"临时 Windows 安装文件"和"临时文件"
4. 确定清理

这个方法就像用编程狮W3Cschool的入门课程一样,简单可靠,系统自动判断哪些能删。

方法二:手动删除(适合有经验的用户)

@echo off
echo 正在检查Config.Msi文件夹...
dir C:\Config.Msi /s


echo.
echo 如果确认要删除,请按任意键继续...
pause


echo 正在安全删除...
takeown /f C:\Config.Msi /r /d y
icacls C:\Config.Msi /grant administrators:F /t
rd /s /q C:\Config.Msi


echo 删除完成!
pause

编程狮提醒:这个批处理脚本需要保存复制到记事本另存为ConfigMsi.bat然后右键”以管理员身份运行”,就像解锁管理员权限才能进入某些系统文件夹一样。

方法三:迁移到其他盘(高手玩法)

如果你不想删除,但C盘空间紧张,可以把它”搬家”:

# 以管理员身份运行PowerShell
# 先创建新位置的文件夹
New-Item -Path "D:\WindowsInstallerTemp" -ItemType Directory


# 复制内容(不要直接移动,防止出错)
Robocopy "C:\Windows\Installer" "D:\WindowsInstallerTemp" /E /COPYALL


# 修改注册表指向新位置(️危险操作,务必先备份注册表)
# 具体路径请访问编程狮技术社区获取详细教程

五、实战案例:小王的C盘瘦身记

小王在W3Cschool编程狮学习Python时,发现C盘只剩5GB空间。他用工具扫描后发现:

  • Config.Msi文件夹占了3.2GB
  • 里面都是三年前安装Office 2016留下的文件

操作步骤

  1. 确认Office使用正常
  2. 使用”方法一”磁盘清理,释放了1.8GB
  3. 剩余1.4GB手动删除(当时没在安装任何软件)
  4. 最后C盘腾出空间,顺利安装了Visual Studio Code

结果:系统运行正常,所有软件都可卸载

六、总结与最佳实践

  1. 别慌张:Config.Msi 是正常系统文件,不是病毒
  2. 优先自动清理:用 Windows 磁盘清理最保险
  3. 手动删除要时机对:确保没有安装任务,且软件运行正常
  4. 定期体检:每半年检查一次,防止”僵尸文件”堆积
  5. 备份习惯:重要数据先备份,再动系统文件

记住:电脑和编程一样,都要遵循”先理解再操作”的原则。如果你想系统学习更多 Windows 知识,欢迎来编程狮W3Cschool查看我们的《Windows11操作系统使用教程》课程,里面有更详细的视频讲解!

DeepSeek生成的HTML代码怎么运行?编程狮教你3种方法(新手必看)

thbcm阅读(124)

前言:很多新手在 DeepSeek 生成 HTML 代码后,面对一串代码却不知道如何运行。就像拿到菜谱却不知道如何开火——本文将用最通俗的方式,教你从零开始运行 HTML 代码,让你立即看到网页效果!

一、HTML代码运行原理:浏览器就是你的”炒锅”

首先理解一个核心概念:HTML 代码不需要编译,浏览器直接就能”炒”(解析)。这和 Python、Java 等需要安装运行环境的语言完全不同。你需要的只是一个浏览器(Chrome、Edge、Firefox 等)。

注意:如果 DeepSeek 生成的是纯 HTML/CSS/JS 代码,直接用下面的方法 1 和方法 2;如果包含 PHP、Python 等后端代码,则需要方法 3。

二、方法1:直接保存运行(最适合新手⭐⭐⭐⭐⭐)

这是最快的方式,5 秒就能看到效果:

步骤详解

  1. 复制代码:在 DeepSeek 对话框中,点击代码块右上角的”复制”按钮
  2. 新建文件:在桌面右键 → 新建 → 文本文档
  3. 粘贴代码:打开记事本,粘贴代码
  4. 另存为:点击文件 → 另存为,关键点来了
    • 文件名:W3Cschool测试页面.html(注意必须是.html结尾)
    • 保存类型:选择”所有文件(.)”
    • 编码:选择”UTF-8″(防止中文乱码)
  5. 双击运行:保存后,双击这个文件,系统会自动用浏览器打开

示例:DeepSeek 生成的 W3Cschool 风格导航栏代码

<!DOCTYPE html>
<html>
<head>
    <title>编程狮学习导航</title>
    <style>
        /* 导航栏样式 - 编程狮经典蓝 */
        .navbar {
            background-color: #2c3e50;
            padding: 15px;
            color: white;
        }
    </style>
</head>
<body>
    <div class="navbar">
        <h1>欢迎来到编程狮(w3cschool.cn)</h1>
    </div>
    <p>这是一个零基础小白也能运行的HTML示例</p>
</body>
</html>

三、方法2:使用在线HTML编辑器(无需安装任何东西)

如果你不想保存文件,或者想边改边看效果:

推荐工具

  1. 编程狮在线编辑器(适合国内用户,速度快)
  1. CodePen(优点:国际知名,功能强大,缺点:国外网站访问比较慢)
  2. JS Bin(简洁易用)

操作步骤(以编程狮在线编辑器为例):

  1. 打开 W3Cschool 官网
  2. 点击导航栏的在线工具→找到HTML在线代码工具
  3. 在左侧代码区粘贴 DeepSeek 生成的代码
  4. 右侧立即显示网页效果,修改代码后实时更新

四、方法3:搭建本地开发环境(适合长期学习)

如果你经常写代码,推荐搭建专业环境:

方案A:使用VS Code(推荐⭐⭐⭐⭐⭐)

# 第一步:下载安装VS Code
# 访问:code.visualstudio.com 或搜索"VS Code中文版"


# 第二步:安装Live Server插件
# 在VS Code扩展商店搜索"Live Server",点击安装


# 第三步:运行代码
# 右键HTML文件 → "Open with Live Server"
# 会自动在浏览器打开,并且保存后自动刷新

方案B:使用Python快速启动(3分钟搞定)

如果你已经安装了Python,可以用一行命令启动本地服务器:

# 在HTML文件所在文件夹,按住Shift+右键 → 打开PowerShell


# Python 3.x 命令:
python -m http.server 8000


# 然后在浏览器访问:http://localhost:8000

五、DeepSeek生成代码的特殊情况处理

情况1:代码包含CSS/JS文件引用

如果代码里有类似这样的内容:

<link rel="stylesheet" href="style.css">
<script src="script.js"></script>

处理方法

  1. 在桌面新建一个文件夹(如我的网站
  2. 把所有文件(HTML、CSS、JS)都保存进去
  3. 双击HTML文件运行

情况2:代码包含PHP/Python等后端语言

DeepSeek 有时会生成完整的全栈代码,例如:

<?php
// 这是PHP代码,需要服务器环境
echo "欢迎来到编程狮学习PHP";
?>

解决方法

  1. 安装本地服务器环境

    • Windows推荐:XAMPP(一键安装Apache+PHP+MySQL)
    • Mac推荐:MAMP

  2. 部署步骤

    # 把代码放到XAMPP的htdocs文件夹
    C:\xampp\htdocs\我的项目\
    
    
    
    
    # 启动Apache服务
    # 浏览器访问:http://localhost/我的项目/

六、常见问题与解决方案

问题 原因 解决方法
打开是乱码 编码不是UTF-8 用记事本另存为,选择UTF-8编码
中文显示为问号 浏览器编码问题 在<head>中添加<meta charset="UTF-8">
图片不显示 图片路径错误 确保图片和HTML在同一文件夹,或用完整路径
样式没效果 CSS没正确链接 检查<link>标签的href路径是否正确
提示”无法访问” PHP/Python无服务器 安装XAMPP或用Python启动http.server

七、编程狮独家技巧:让 DeepSeek 代码更好用

技巧1:让DeepSeek生成完整代码 提问时这样说:

请生成一个完整的HTML文件,包括DOCTYPE、html、head、body标签,适合直接在浏览器运行,风格参考编程狮官网

技巧2:指定CSS内嵌

请把CSS样式写在style标签内,不要单独生成CSS文件,方便我直接复制运行

技巧3:中文注释

请在代码中添加中文注释,方便我这个小白的理解"

八、总结与推荐

新手最佳路径

  1. 先用方法1(直接保存)体验成功感
  2. 学习HTML基础时,用方法2HTML 在线编辑器)最方便
  3. 确定深入学习后,再搭建方法3(VS Code环境)

编程狮推荐资源

  • 零基础入门:关注编程狮公众号,回复”HTML”获取免费教程
  • 在线练习:访问 w3cschool.cn → 编程实战 → 边学边练
  • AI 助教:在编程狮学习的同时打开Deepseek豆包元宝等 AI 工具,24小时在线,遇到问题随时开问,还可以帮你总结提炼,学习效率直接翻倍。

记住:运行 HTML 代码就像打开一个文档一样简单,大胆去尝试吧!

关于编程狮:编程狮(w3cschool.cn)是国内知名在线编程学习平台,提供Python、HTML、Java等零基础免费教程,在线代码工具让您无需配置环境即可学习编程。关注我们,让编程学习更简单!

别再盲选AI模型了!这个宝藏平台让你免费试遍主流大模型

thbcm阅读(138)

作为一名经常折腾 AI 应用的开发者,我曾经为选模型这件事头疼不已——

  • 各家模型都说自己好,实际性能到底怎么样?
  • 价格五花八门,哪个才是性价比之王?
  • 好不容易看上某个模型,一接入才发现延迟高得离谱…

直到我发现了 AIPing,简直像找到了AI开发界的”大众点评+试吃中心”!

这平台有什么绝活?

它不是一个简单的模型聚合站,而是专业评测机构出身的硬核平台:

20+家供应商、数百个模型的真实性能数据
专业团队高频测试,延迟、吞吐量、可靠性一目了然
实时更新的排行榜,谁家有波动第一时间知道
详细的参数数据库,上下文长度、价格、最大输出都能横向对比

简单说就是:别人吹得天花乱坠,AIPing直接用数据说话

新用户福利真的香!

最让我兴奋的是最近的新用户活动:

三大主流模型首月免费畅用:

  • Kimi-K2(长文本理解神器)
  • MiniMax-M2(多模态实力派)
  • GLM-4.6(中文场景优化专家)

注册再送30元赠金! 可以直接体验平台上其他付费模型,比如GPT-4、Claude等明星产品。

️ 重点来了:建议通过我的专属链接注册,福利一步到位

点击链接领取福利https://aiping.cn/#?channel_partner_code=DEHNZQUU

我的使用场景

上周我要做个智能客服项目,就是靠AIPing:

  1. 先查排行榜,锁定3个延迟<500ms的候选模型
  2. 用免费额度做A/B测试,发现Kimi-K2在咱们业务场景下准确率最高
  3. 最后用赠金买了点GPT-4做兜底策略

整个过程没花一分钱就定了技术方案,老板都夸我效率爆表

适合谁用?

  • AI开发者:选型不求人,数据驱动决策
  • 产品经理:快速验证模型效果,降低试错成本
  • 技术负责人:做方案预算时有个权威参考
  • AI爱好者:免费玩转多个顶级模型

说真的,这种既能省钱的平台,真心建议每个AI从业者都收藏备用。毕竟,省下来的预算和踩坑时间,都是自己的

最后再放一次专属注册链接,30元赠金不领白不领!

立即注册:https://aiping.cn/#?channel_partner_code=DEHNZQUU

Tokens是什么意思?Token在AI大模型中的含义

thbcm阅读(136)

编程狮(W3Cschool)课程学习 AI 开发的过程中,很多初学者都会被”Token”这个概念绕晕。别担心!今天编程狮就用最接地气的方式,把这个AI大模型的核心概念彻底讲明白。

一、Token 到底是什么?

(一)语言的“积木块”

Token就是AI模型用来”搭建”语言的最小积木块

Token 可以被视为语言的“积木块”,是 AI 大模型处理文本时的最小单位。就像我们用乐高积木搭建城堡一样,AI 模型通过这些“积木块”来理解和生成语言。在自然语言处理(NLP)中, Token 通常是一个单词、一个标点符号、一个子词,甚至是一个字符。

人类读文章是一个字一个字、一个词一个词地理解,但AI大模型(比如ChatGPT、文心一言)的处理方式更特别:它们会先把整段文字拆分成一个个小块,这些小块就是Token。每个Token都会被转换成一个数字编号,再变成一堆数学向量,最后让计算机进行计算。

举个生活化的例子:

  • 人类看句子:我喜欢编程狮的AI课程
  • AI看到的Token可能是:['我', '喜欢', '编程', '狮', '的', 'AI', '课程']

每个 Token 就像一块积木,AI 模型通过拼凑这些积木来理解整个句子的意思。

二、Token的三种常见拆分方式

不同的语言和模型会有不同的分词方式。

在编程狮的AI实战课程中,我们会遇到三种主流的Token拆分策略:

1. 词级别(Word-level):按词切分

适合中文等语言,每个词或单字作为一个Token。

# 示例:中文句子分词
原文:你好,世界!
Token结果:['你好', ',', '世界', '!']

2. 子词级别(Subword-level):拆成词根词缀

适合英文等语言,能处理生词问题。

# 示例:英文单词拆分
原文:unhappiness
Token结果:['un', '##happiness']
(##表示这是词根的一部分)

3. 字符级别(Character-level):按字符切分

最细粒度,计算量最大,但极少用在大模型中。

关键点:不同AI模型采用不同的分词规则。比如编程狮的AI课程会教你,GPT系列用BPE算法,BERT用WordPiece算法,这些算法决定了Token怎么切分。

三、Token在AI大模型中的三大作用

作用1:输入限制——AI的”内存条”容量

每个大模型都有Token数量上限,就像手机内存有容量限制一样。

当我们将一段文字输入到AI模型中时,模型首先会将这段文字拆分成一个个Token。同样,当AI生成回答时,也是以Token为单位逐个生成的。这就像是我们写文章时,一个字一个字地写,AI模型则是通过处理和生成Token来完成语言的生成。

常见模型 Token上限 约等于多少汉字
GPT-3.5 4K 约3000字
GPT-4 32K 约2.4万字
文心一言4.0 8K 约6000字

超过上限会怎样? 模型会”失忆”!最早的对话内容会被自动删除,就像内存满了自动清理旧数据。这就是为什么聊天聊长了,AI会忘记最开始设定的角色。

作用2:计费标准——AI服务的”电表”

使用Token可以提高处理效率,因为AI可以更快地识别和处理预定义的单元。同时,Token的数量也直接决定了模型处理文本所需的计算资源和时间。这也是为什么几乎所有大模型公司都按照Token数量计费,因为Token数量直接对应背后的计算成本。

这是最直接的影响!几乎所有AI平台都按Token收费,包括:

  • 输入Token(你写的Prompt)
  • 输出Token(AI生成的回答)

计费公式:总费用 = (输入Token数 + 输出Token数) × 单价

省钱小技巧

  • 删除冗余词语
  • 用简洁的表达方式
  • 限制max_tokens参数
  • 长文本分段生成

作用3:模型理解——AI的”思考基石”

通过分析Token的顺序和它们之间的关系,AI模型可以理解句子的意思。比如,当我们说“我喜欢编程狮的AI课程”时,模型会通过分析这些Token之间的关系来理解这句话的意思。

Token的质量直接影响AI的理解能力:

  • 分词准确 → AI理解更精准
  • Token太少 → 信息丢失
  • Token太多 → 计算缓慢

就像做菜,食材切得好,炒出来的菜才好吃。Token切分得合理,AI生成的内容才通顺。

四、如何估算文本的Token数量?

编程狮推荐实用估算方法:

经验法则:

  • 中文:1个汉字 ≈ 1.2-1.5个Token
  • 英文:1个单词 ≈ 0.7-1.3个Token
  • 标点符号:每个符号 ≈ 1个Token
  • emoji:每个表情 ≈ 2-3个Token

快速估算公式:

汉字数量 × 1.3 ≈ Token总数

精确计算方法

# 使用tiktoken库精确计算(编程狮推荐)
import tiktoken


def 计算token数(文本, 模型名="gpt-3.5-turbo"):
    """编程狮AI课堂:精确计算Token数量"""
    编码器 = tiktoken.encoding_for_model(模型名)
    token列表 = 编码器.encode(文本)
    return len(token列表)


# 示例
我的文本 = "欢迎来到编程狮学习AI大模型"
token数量 = 计算token数(我的文本)
print(f"这段文字用了 {token数量} 个Token")

当然,这只是一个大致的估算,具体的数量还需要根据实际的模型和分词器来确定。

五、Token优化实战:让AI更高效

在实际应用中,优化Token的使用是非常重要的。例如,在编写Prompt(提示词)时,我们可以尽量使用简洁明了的语言,避免冗余的词语,这样可以减少Token的数量,从而降低计算成本。

场景1:长文档处理

问题:10万字论文超出模型限制 解决方案(编程狮AI项目实战技巧):

  1. 分段处理,每段5000字
  2. 使用”继续”指令衔接内容
  3. 提取核心摘要后再提问

场景2:节省开发成本

优化前

"请帮我写一个Python函数,这个函数要能够接收两个参数,然后返回它们的和,函数名要叫add_numbers"

Token数:约45个

优化后

"Python函数:接收两参数,返回其和,函数名add_numbers"

Token数:约20个

节省55%成本!

场景3:避免AI失忆

技巧

  1. 关键信息放在对话末尾
  2. 定期总结上下文
  3. 使用系统提示(System Prompt)强化角色设定

六、总结:Token学习的核心要点

通过编程狮的这篇入门教程,你应该已经掌握:

  1. Token是AI处理语言的最小积木,连接人类语言与机器理解的桥梁
  2. Token限制决定了AI的”记忆力”,影响长对话质量
  3. Token计费直接关系使用成本,优化Prompt能省不少钱
  4. 不同模型有不同的分词器,Token数量会差异很大
  5. 估算和优化是AI开发的必备技能

记住黄仁勋那句话: “It’s all about tokens!” 在AI时代,谁更懂Token,谁就能更高效地使用大模型。

如果你对AI开发感兴趣,或者想深入了解Token在AI大模型中的应用,欢迎访问编程狮(W3Cschool)官网,学习更多相关的知识。

HarmonyOS运动语音开发:如何让运动开始时的语音播报更温暖

thbcm阅读(144)

在运动类应用中,语音播报功能不仅可以提升用户体验,还能让运动过程更加生动有趣。想象一下,当你准备开始运动时,一个温暖的声音提醒你“3,2,1,运动开始了”,是不是比冷冰冰的文字提示更有动力呢?本文将结合鸿蒙(HarmonyOS)开发实战经验,深入解析如何实现运动开始时的语音播报功能,让每一次运动都充满活力。

联系我们