探秘Transformer系列之(6)— token

thbcm阅读(226)

从前面章节我们可以知道,Transformer接受的是高维向量(word embedding),而从文本到向量的转换分为两个阶段:分词和embedding化,分别产出token和word embedding。在构建大模型的过程中,token 分词与word embedding扮演着举足轻重的角色。它们不仅是模型理解文本语言的基础,还深刻影响着模型的性能与精度。本篇会介绍如何做好单词到数字的映射,下一篇介绍如何从数字转换到embedding。

使用Go复刻skiplist核心功能

thbcm阅读(168)

因为作者能力有限,本文只是对跳表的核心功能:创建节点与跳表、插入节点、删除节点、获取节点rank、根据rank获取节点、获取分数区间的ele集合进行复刻,其余的需要自己去实现。

我与微信审核的“相爱相杀”看个人小程序副业

thbcm阅读(227)

线上项目除了做小程序还可以做在线web或者App,为什么一开始没有选择做web或者App了,因为小程序上线流程相对简单,你不用去买服务器,也不用去注册域名,代码直接托管在腾讯服务器,App的话你就更不用说了,开发App相对会麻烦些,特别苹果,你得有苹果手机和苹果电脑,App要申请证书还需要软著,如果想把自己的项目发布出去就得上架各应用市场,那也是很麻烦的,而且更重要的是现在越来越多的应用市场不再接收个人开发的App项目了。

manim边学边做–相机Camera简介

thbcm阅读(198)

它就像我们观察动画的
眼睛,通过控制相机的位置、角度和视野,可以创造出丰富多样的视觉效果。

联系我们