大语言模型(LLM)很火,讨论的文章铺天盖地,但对于没有机器学习背景的人来说,看多了只是粗浅了解了一堆概念,疑惑只增不减。 本文尝试从零开始,用python实现一个极简但完整的大语言模型,在过程中把各种概念“具象化”,让大家亲眼看到、亲手写出 ...
上一篇文章 《从零开始200行python代码实现LLM》,实现了一个“诗词生成器”,从一个基于“概率统计”的实现开始,最后使用pytorch,实现了一个经典的Bigram模型。 在Bigram模型里,每一个字只和前一个字有关,尽管是这样,我们的babygpt_v1.py 也输出了“渐觉是路 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果