“用于训练/微调中型 GPT 的最简单、最快的存储库”- Andrej Karpathy,大约 600 行 Python。
原文: http://simonwillison.net/2023/Jan/2/nanogpt/#atom-everything
翻译英文优质信息和名人推特
“用于训练/微调中型 GPT 的最简单、最快的存储库”- Andrej Karpathy,大约 600 行 Python。
原文: http://simonwillison.net/2023/Jan/2/nanogpt/#atom-everything