thbcm的文章

技术专栏

深度学习基础理论————分布式训练(模型并行/数据并行/流水线并行/张量并行)

thbcm阅读(85)赞(0)

模型并行 是指将一个模型的不同部分(如层或子模块)分配到不同的设备上运行。它通常用于非常大的模型,这些模型无法完整地放入单个设备的内存中。在模型并行中,数据会顺序通过各个层,即一层处理完所有数据之后再传递给下一层。这意味着,在任何时刻,只有...

大语言模型提示技巧(二)-给模型时间思考-小狮博客
技术专栏

大语言模型提示技巧(二)-给模型时间思考

thbcm阅读(98)赞(0)

问题: 某人在银行开立一年期定期存款10万元,年息1%。假设用户在前两年末到期时取出当年利息的一半,然后继续定存一年且年息不变,直至存满3年后全部取出,此时用户取出的金额是多少? 解: 第一年本金100000元,到期利息:100000*0....

联系我们