🚀 Home Llama 3.2 3B
Home Llama 3.2 3B模型是基于Meta的Llama 3.2 3B模型进行微调得到的。该模型能够控制用户家中的设备,还能执行基本的问答任务。此模型经过专门训练,支持英语、德语、西班牙语和法语;其基础模型还支持意大利语、葡萄牙语、印地语和泰语。微调数据集是一个自定义整理的数据集,旨在教会模型进行函数调用。
🚀 快速开始
该模型使用Lama.cpp进行量化,以便在像树莓派这类资源极低的环境中运行,这类环境在Home Assistant安装中很常见。
模型可以使用Llama3提示格式作为“指令”类型的模型。系统提示用于提供有关Home Assistant安装状态的信息,包括可用设备和可调用的服务。
示例“系统”提示:
你是 'Al',一个能控制房屋内设备的实用AI助手。仅根据提供的信息按指示完成以下任务。
服务:light.turn_off(),light.turn_on(brightness,rgb_color),fan.turn_on(),fan.turn_off()
设备:
light.office '办公室灯' = 开启;80%
fan.office '办公室风扇' = 关闭
light.kitchen '厨房灯' = 开启;80%;红色
light.bedroom '卧室灯' = 关闭
模型的输出将包括一个应反馈给用户的响应,以及一个可选的代码块,该代码块将调用不同的Home Assistant“服务”。模型进行函数调用的输出格式如下:
现在为你打开厨房的灯
```homeassistant
{ "service": "light.turn_on", "target_device": "light.kitchen" }
```
由于基础模型进行了指令微调,该模型还能够执行基本的指令和问答任务。例如,模型能够执行以下基本逻辑任务:
用户:如果玛丽7岁,而我比她大3岁。我多少岁?
助手:如果玛丽7岁,那么你10岁(7 + 3 = 10)。
✨ 主要特性
- 能够控制用户家中的设备。
- 支持英语、德语、西班牙语和法语。
- 可在资源极低的环境中运行。
- 能够执行基本的指令和问答任务。
📦 安装指南
文档未提及安装步骤,此处跳过。
💻 使用示例
基础用法
用户:如果玛丽7岁,而我比她大3岁。我多少岁?
助手:如果玛丽7岁,那么你10岁(7 + 3 = 10)。
高级用法
You are 'Al', a helpful AI Assistant that controls the devices in a house. Complete the following task as instructed with the information provided only.
Services: light.turn_off(), light.turn_on(brightness,rgb_color), fan.turn_on(), fan.turn_off()
Devices:
light.office 'Office Light' = on;80%
fan.office 'Office fan' = off
light.kitchen 'Kitchen Light' = on;80%;red
light.bedroom 'Bedroom Light' = off
用户:请关闭办公室的灯
助手:turning off the office lights for you now
```homeassistant
{ "service": "light.turn_off", "target_device": "light.office" }
## 📚 详细文档
### 数据集
合成SFT数据集 - https://huggingface.co/datasets/acon96/Home-Assistant-Requests
### 许可证
该模型是Llama 3.2模型系列的微调版本,遵循LLAMA 3.2社区许可协议。
| 属性 | 详情 |
|------|------|
| 模型类型 | 基于Meta的Llama 3.2 3B模型微调 |
| 训练数据 | [自定义整理的数据集](https://github.com/acon96/home-llm) |
| 支持语言 | 英语、德语、西班牙语、法语;基础模型还支持意大利语、葡萄牙语、印地语和泰语 |
| 量化方式 | 使用Lama.cpp进行量化 |
| 提示格式 | Llama3提示格式 |
| 基础模型 | meta-llama/Llama-3.2-3B-Instruct |
| 基础模型关系 | 微调 |
| 微调数据集 | [自定义整理的数据集](https://github.com/acon96/home-llm) |
| 模型用途 | 控制家庭设备、基本问答、指令任务 |
| 输出格式 | 响应 + 可选的代码块调用Home Assistant服务 |
| 数据集链接 | [合成SFT数据集](https://huggingface.co/datasets/acon96/Home-Assistant-Requests) |
| 许可证 | LLAMA 3.2社区许可协议 |
| 许可证链接 | [LICENSE](https://huggingface.co/acon96/Home-Llama-3.2-3B/raw/main/LICENSE) |