
大语言模型LLMBook
本书更关注为大模型初学者提供整体的技术讲解,为此我们在内容上进行了大范围的更新与重组,力图展现一个系统的大模型技术框架和路线图。本书适用于具有深度学习基础的读者阅读,可以作为一本基础的大模型参考书籍。在准备中文书的过程中,我们广泛阅读了现有的经典论文、相关代码和学术教材,从中提炼出核心概念、算法与模型,并进行了系统性的组织与讲解。我们对于每个章节的内容初稿都进行了多次修正,力求表达的清晰性与准确性。
Transformers 是由 Hugging Face 开发的一个 NLP 包,支持加载目前绝大部分的预训练模型。随着 BERT、GPT 等大规模语言模型的兴起,越来越多的公司和研究者采用 Transformers 库来构建 NLP 应用。
本教程旨在帮助 NLP 初学者快速熟悉 Transformers 库的使用方法,并且通过实例带领读者一步一步构建自己的模型,完成各种 NLP 任务。
读者只需要熟悉 Python 语言即可,并不需要提前掌握 Keras、Pytorch 等深度学习包的使用。