GitHub - datawhalechina/llm - cookbook:面向开发者的LLM入门教程,吴恩达大模型系列课程中文版
GitHub - datawhalechina/llm - cookbook:面向开发者的LLM入门教程,吴恩达大模型系列课程中文版
技术背景
大语言模型(LLM)正在逐步改变人们的生活,对于开发者而言,如何基于 LLM 提供的 API 快速、便捷地开发一些具备更强能力、集成 LLM 的应用,来实现更新颖、更实用的功能,是急需学习的重要能力。吴恩达老师与 OpenAI 合作推出的大模型系列教程,从大模型时代开发者的基础技能出发,介绍了如何基于大模型 API、LangChain 架构快速开发结合大模型强大能力的应用。但这些教程目前只支持英文版且国内访问受限,因此 datawhalechina 发起了 llm - cookbook 项目。
实现步骤
学习准备
- 至少一个 LLM API(最好是 OpenAI,如果是其他 API,可能需要参考其他教程对 API 调用代码进行修改)。
- 能够使用 Python Jupyter Notebook。
课程学习
本教程共包括 11 门课程,分为必修类、选修类两个类别。
必修类课程
- 面向开发者的 Prompt Engineering:基于吴恩达老师《ChatGPT Prompt Engineering for Developers》课程打造,介绍如何构造 Prompt 并基于 OpenAI 提供的 API 实现包括总结、推断、转换等多种常用功能。
- 搭建基于 ChatGPT 的问答系统:基于《Building Systems with the ChatGPT API》课程打造,指导开发者基于 ChatGPT 提供的 API 开发一个完整的、全面的智能问答系统。
- 使用 LangChain 开发应用程序:基于《LangChain for LLM Application Development》课程打造,深入介绍 LangChain,帮助学习者基于其开发完整且具备强大能力的应用程序。
- 使用 LangChain 访问个人数据:基于《LangChain Chat with Your Data》课程打造,拓展 LangChain 提供的个人数据访问能力,指导开发能访问用户个人数据、提供个性化服务的大模型应用。
选修类课程
- 使用 Gradio 搭建生成式 AI 应用:基于《Building Generative AI Applications with Gradio》课程打造,指导使用 Gradio 通过 Python 接口程序为生成式 AI 构建用户界面。
- 评估改进生成式 AI:基于《Evaluating and Debugging Generative AI》课程打造,结合 wandb,提供跟踪和调试生成式 AI 模型的方法和工具。
- 微调大语言模型:基于《Finetuning Large Language Model》课程打造,结合 lamini 框架,讲述在本地基于个人数据微调开源大语言模型的方法。
- 大模型与语义检索:基于《Large Language Models with Semantic Search》课程打造,针对检索增强生成,讲述高级检索技巧以实现更准确、高效的检索增强 LLM 生成效果。
- 基于 Chroma 的高级检索:基于《Advanced Retrieval for AI with Chroma》课程打造,介绍基于 Chroma 的高级检索技术,提升检索结果的准确性。
- 搭建和评估高级 RAG 应用:基于《Building and Evaluating Advanced RAG Applications》课程打造,介绍构建和实现高质量 RAG 系统所需的关键技术和评估框架。
- LangChain 的 Functions、Tools 和 Agents:基于《Functions, Tools and Agents with LangChain》课程打造,介绍基于 LangChain 的新语法构建 Agent 的方法。
- Prompt 高级技巧:包括 CoT、自我一致性等多种 Prompt 高级技巧的基础理论与代码实现。
核心代码
文档中未明确给出具体核心代码,但项目的 content
目录下有基于原课程复现的双语版代码,是可运行的 Notebook。以下是一个简单的使用 OpenAI API 进行 Prompt 调用的 Python 示例代码:
1 |
|
最佳实践
- 初学者先系统学习必修类课程,掌握入门 LLM 所有方向都需要掌握的基础技能和概念。
- 学习必修类课程时,按照列出的顺序进行学习。
- 在掌握必修类课程之后,根据自己的兴趣选择选修类课程进行深入学习。
- 参考项目中
content
目录下的双语版代码,进行实践操作。
常见问题
- API 问题:如果使用非 OpenAI 的 API,可能需要参考其他教程对 API 调用代码进行修改。
- 课程复现:如果有喜欢但项目还未复现的吴恩达老师大模型课程,开发者可参考已有课程的格式和写法来对课程进行复现并提交 PR,审核通过后会根据课程内容进行分级合并。
GitHub - datawhalechina/llm - cookbook:面向开发者的LLM入门教程,吴恩达大模型系列课程中文版
https://119291.xyz/posts/github-datawhalechina-llm-cookbook-llm-tutorial/