返回探索
unsloth

unsloth - 本地模型训练与运行工具

本地运行训练多种模型的Web工具,支持Gemma、Qwen3.5等

4
61,449 浏览
科学研究
访问官网

详细介绍

unsloth 仓库中文介绍文档

unsloth 是一个本地训练和运行多种开放模型的Web UI工具,由 Unsloth Studio 提供,汇聚了 Gemma、Qwen3.5、DeepSeek、gpt-oss 等多种模型的支持。

要点:

  • unsloth 是一个本地训练和运行多种开放模型的Web UI工具
  • 由 Unsloth Studio 开发维护
  • 支持 Gemma、Qwen3.5、DeepSeek、gpt-oss 等多种模型

一、核心信息速览

维度 详情
:--- :---
仓库地址 [unsloth](https://github.com/unslothai/unsloth)
许可证 MIT
核心定位 在本地运行和训练多种开放模型的Web UI工具
主要语言 Python
适用人群 AI开发者;研究人员;本地化部署用户
关键亮点 支持多种模型;加速训练;节省显存;提供UI界面

二、核心功能

功能模块 描述 典型场景
:--- :--- :---
模型运行 支持多种模型的本地运行,包括GGUF、LoRA适配器等 快速测试和使用各种模型
模型训练 支持多种模型的本地训练,提升训练速度并减少显存占用 本地进行模型微调
模型导出 支持将模型导出为多种格式,如GGUF、16-bit safetensors等 便于模型分发和部署
工具调用 支持自动修复的工具调用和网络搜索 增强模型的交互能力
代码执行 支持在安全环境中执行代码 用于测试和验证代码
多媒体支持 支持上传图像、音频、PDF、代码等多种文件类型 与模型进行多模态交互
自动参数调优 自动优化推理参数 提升模型表现
模型兼容性 与多个模型团队合作,修复模型中的问题 提高模型准确性

三、快速上手

1. 环境准备

  • Python 3.8 或更高版本
  • CUDA 11.8 或更高版本(如果使用GPU)

2. 安装方式

pip install unsloth

3. 基础配置

  • 安装完成后,运行 unsloth 命令启动 Web UI
  • 通过浏览器访问 http://localhost:7860 进行操作

4. 核心示例

from unsloth import load_model_and_tokenizer

model, tokenizer = load_model_and_tokenizer("unsloth/gemma-7b-it")

四、核心亮点

  1. 支持多种模型:支持 Gemma、Qwen3.5、DeepSeek、gpt-oss 等多种模型。
  2. 加速训练:训练速度提升至原来的 2 倍,同时节省 70% 显存。
  3. 提供UI界面:提供直观的 Web UI,方便用户进行模型训练和运行。
  4. 模型兼容性:与多个模型团队合作,修复模型中的问题,提高模型准确性。

五、适用场景

  1. AI开发者:用于快速测试和部署各种模型。
  2. 研究人员:用于进行模型训练和研究。
  3. 本地化部署用户:用于在本地环境中运行和训练模型,避免依赖云端服务。

六、优缺点

优势

  • 支持多种模型,灵活性高
  • 训练速度快,显存占用低
  • 提供直观的Web UI,易于使用

不足

  • 需要一定的技术背景才能进行配置和使用
  • 对于某些复杂任务可能需要额外的定制开发

七、与同类工具对比(可选)

工具 类型 核心差异
:--- :--- :---
unsloth 开源 免费开源,支持多种模型,提供UI界面
Hugging Face Transformers 开源 提供丰富的模型库,但缺乏本地训练支持

八、总结

unsloth 是一款适合AI开发者和研究人员使用的本地训练和运行多种开放模型的Web UI工具,具有支持多种模型、训练速度快、显存占用低等优势,但在使用时需要一定的技术背景。

相关工具