常用大模型微调工具

常用的大模型微调工具包括多种,这些工具能够帮助用户高效地微调预训练的大型模型以适应特定的下游任务。以下是一些常见的大模型微调工具:

PEFT(Parameter-Efficient Fine-Tuning)

PEFT是Hugging Face开源的一个参数高效微调大模型的工具,里面集成了多种微调大模型的方法,可以通过微调少量参数就达到接近微调全量参数的效果,使得在GPU资源不足的情况下也可以微调大模型。

PEFT技术包括LoRA、QLoRA、适配器调整(Adapter Tuning)、前缀调整(Prefix Tuning)、提示调整(Prompt Tuning)、P-Tuning及P-Tuning v2等多种方法。

llama factory

一款web可视化微调工具,支持多种模型,如LLaMA、LLaVA、Mistral、Mixtral-MoE、Qwen、Yi、Gemma、Baichuan、ChatGLM、Phi等。

提供多种微调方法,如(增量)预训练、(多模态)指令监督微调、奖励模型训练等。

支持多种精度和先进算法,如16比特全参数微调、冻结微调、LoRA微调和基于AQLM/AWQ/GPTQ/LLM.int8/HQQ/EETQ的2/3/4/5/6/8比特QLoRA微调等。

XTuner

XTuner是一款大模型单卡低成本微调工具,能够帮助用户在使用有限资源的情况下进行高效的微调。

提供了数据引擎和多数据样本拼接等功能,优化了显存占用情况。

云训练平台

Amazon SageMaker:一项完全管理的服务,为开发人员和数据科学家提供快速构建、培训和部署机器学习模型的能力。它提供了一个强大而灵活的平台,允许用户运行自定义Python脚本来完成微调任务。

Google Colab:一种流行的基于云的Jupyter笔记本电脑服务,提供对计算资源的免费访问,包括GPU和TPU,使其成为微调大型语言模型(LLM)的绝佳平台,对初学者特别友好。

百度千帆平台:提供了包括文心一言底层模型和第三方开源大模型(如llama3),以及各种AI开发工具和整套开发环境,方便客户轻松使用和开发大模型应用。支持数据管理、自动化模型SFT以及推理服务云端部署的一站式大模型定制服务。

阿里云百炼平台:基于通义大模型、行业大模型(如llama3)以及三方大模型的一站式大模型开发平台。面向企业客户和个人开发者,提供完整的模型服务工具和全链路应用开发套件,预置丰富的能力插件,提供API及SDK等便捷的集成方式。