
Transformer Architecture 专题
共 3 篇文章,按时间倒序展示。


Karpathy nanochat:8000行Rust代码实现LLM全流程
Karpathy开源项目nanochat,以不到8000行Rust代码完整实现了大语言模型从分词器训练、预训练、多任务微调、强化学习到轻量推理的全流程,并提供了CLI与Web界面。
TechFoco

共 3 篇文章,按时间倒序展示。


Karpathy开源项目nanochat,以不到8000行Rust代码完整实现了大语言模型从分词器训练、预训练、多任务微调、强化学习到轻量推理的全流程,并提供了CLI与Web界面。
