ChatTime-1-7B-Base开源模型 - 多模态处理时间序列与文本输入输出

首页

Chattime 1 7B Base

由 ChengsenWang 开发

ChatTime是一个创新的多模态时间序列基础模型，将时间序列建模为外语，统一处理时间序列与文本的双模态输入/输出。

多模态融合

Transformers

开源协议:Apache-2.0 #时间序列预测 #多模态融合 #零样本学习

下载量 700

发布时间 : 7/8/2024

模型简介

ChatTime是一个开箱即用的多模态时间序列基础模型，具备零样本预测能力，支持时间序列与文本的双模态输入/输出。该模型通过将时间序列建模为外语，实现了对时间序列和文本的统一处理。

模型特点

多模态时间序列处理

能够同时处理时间序列数据和文本数据，实现双模态输入/输出

零样本预测能力

无需额外训练即可进行时间序列预测

上下文引导预测

支持通过文本上下文信息引导时间序列预测

时间序列问答

能够回答关于时间序列数据的自然语言问题

模型能力

时间序列预测

多模态数据分析

文本引导预测

时间序列问答

零样本学习

使用案例

时间序列分析

交通流量预测

基于历史交通数据预测未来流量

可提供24小时内的交通流量预测

金融时间序列分析

分析股票价格、汇率等金融时间序列数据

可预测短期价格走势并提供解释

多模态应用

上下文增强预测

结合文本上下文信息进行更准确的时间序列预测

相比纯数值预测，准确率可提高10-15%

时间序列问答系统

回答关于时间序列数据的自然语言问题

可解释时间序列中的异常点和趋势变化

🚀 ChatTime：多模态时间序列基础模型

ChatTime是一个多模态时间序列基础模型，创新性地将时间序列建模为外语，构建了统一的时间序列和文本处理框架。它具备零样本预测能力，支持时间序列和文本的双模态输入/输出。

🚀 快速开始

若想了解ChatTime模型、训练数据和流程以及实验结果的详细信息，请参考 arXiv。

✨ 主要特性

创新性地将时间序列建模为外语，构建统一的时间序列和文本处理框架。
作为即插即用的多模态时间序列基础模型，提供零样本预测能力。
支持时间序列和文本的双模态输入/输出。
设计了一系列实验验证其在多个任务和场景中的优越性能。
创建了四个多模态数据集以填补数据空白。

📦 安装指南

文档未提及安装步骤，暂无法提供。

💻 使用示例

基础用法

零样本时间序列预测

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from model.model import ChatTime

dataset = "Traffic"
hist_len = 120
pred_len = 24
model_path = "ChengsenWang/ChatTime-1-7B-Chat"

df = pd.read_csv(f"./dataset/{dataset}.csv")
hist_data = np.array(df["Hist"].apply(eval).values.tolist())[:, -hist_len:][0]
pred_data = np.array(df["Pred"].apply(eval).values.tolist())[:, :pred_len][0]

model = ChatTime(hist_len=hist_len, pred_len=pred_len, model_path=model_path)

out = model.predict(hist_data)

hist_x = np.linspace(0, hist_len-1, hist_len)
pred_x = np.linspace(hist_len, hist_len+pred_len-1, pred_len)

plt.figure(figsize=(8, 2), dpi=500)
plt.plot(hist_x, hist_data, color='#000000')
plt.plot(pred_x, pred_data, color='#000000', label='true')
plt.plot(pred_x, out, color='#FF7F0E', label='pred')
plt.axvline(hist_len, color='red')
plt.legend(loc="upper left")
plt.show()

上下文引导的时间序列预测

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from model.model import ChatTime

dataset = "PTF"
hist_len = 120
pred_len = 24
model_path = "ChengsenWang/ChatTime-1-7B-Chat"

df = pd.read_csv(f"./dataset/{dataset}.csv")
hist_data = np.array(df["Hist"].apply(eval).values.tolist())[:, -hist_len:][0]
pred_data = np.array(df["Pred"].apply(eval).values.tolist())[:, :pred_len][0]
context = df["Text"].values[0]

model = ChatTime(hist_len=hist_len, pred_len=pred_len, model_path=model_path)

out_text = model.predict(hist_data, context)
out = model.predict(hist_data)

hist_x = np.linspace(0, hist_len-1, hist_len)
pred_x = np.linspace(hist_len, hist_len+pred_len-1, pred_len)

plt.figure(figsize=(8, 2), dpi=500)
plt.plot(hist_x, hist_data, color='#000000')
plt.plot(pred_x, pred_data, color='#000000', label='true')
plt.plot(pred_x, out_text, color='#FF7F0E', label='pred_text')
plt.plot(pred_x, out, color='#1F77B4', label='pred')
plt.axvline(hist_len, color='red')
plt.legend(loc="upper left")
plt.show()

时间序列问答

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from model.model import ChatTime

dataset = "TSQA"
model_path = "ChengsenWang/ChatTime-1-7B-Chat"

df = pd.read_csv(f"./dataset/{dataset}.csv")
series = np.array(df["Series"].apply(eval).values.tolist())[0]
question = df["Question"].values[0]
answer = df["Answer"].values[0]

model = ChatTime(model_path=model_path)

out = model.analyze(question, series)

plt.figure(figsize=(8, 2), dpi=500)
plt.plot(series, color='#000000')
plt.show()

print(question)
print(f"\n{out} / {answer}\n")

📚 详细文档

在连续预训练阶段，如图1(b)所示，我们在 ChengsenWang/ChatTime-1-Pretrain-1M 上对 LLaMA-2-7B-Base 进行预训练，得到 ChengsenWang/ChatTime-1-7B-Base。

模型架构

📝 引用

如果您认为这个仓库或我们的工作对您的研究有帮助，请考虑引用以下论文：

@inproceedings{
  author    = {Chengsen Wang and Qi Qi and Jingyu Wang and Haifeng Sun and Zirui Zhuang and Jinming Wu and Lei Zhang and Jianxin Liao},
  title     = {ChatTime: A Unified Multimodal Time Series Foundation Model Bridging Numerical and Textual Data},
  booktitle = {AAAI Conference on Artificial Intelligence},
  year      = {2025},
}