五六论坛

标题: 新盛娱乐游戏APP下载链接 xs10159.com [打印本页]

作者: xszd10101    时间: 昨天 20:54
标题: 新盛娱乐游戏APP下载链接 xs10159.com
新盛公司游戏APP下载链接【xs10159.com 】腾龙公司游戏下载链接【xs10159.com】from transformers import AutoTokenizer, AutoModelForCausalLMmodel_path = "./qwen1.5-1.8b-chat" # 离线大模型的本地保存目录def local_model_summary(text: str, max_new_tokens=256) -> str:    """ 国内常用的离线大模型有阿里Qwen、智谱GLM、深度求索DeepSeek、百度文心等等,以千问的文本大模型为例,又有Qwen1.5-1.8B-Chat和Qwen1.5-0.5B-Chat两种。
Qwen1.5是一系列不同大小的解码器语言模型,包括基础语言模型及其对齐的聊天模型。它基于Transformer架构,使用SwiGLU激活函数、注意力QKV偏置、组查询注意力、滑动窗口注意力与全注意力混合等技术。此外,Qwen1.5还提供了改进后适应多种自然语言和代码的分词器。
其中Qwen1.5-1.8B-Chat的模型页面为 https://modelscope.cn/models/Qwen/Qwen1.5-1.8B-Chat ,名称中的1.8B指的是18亿参数(1.8 Billion),模型文件大小为3.69GB。
Qwen1.5-0.5B-Chat的模型页面为 https://modelscope.cn/models/Qwen/Qwen1.5-0.5B-Chat ,名称中的0.5B指的是5亿参数(0.5 Billion),模型文件大小为1.25GB






欢迎光临 五六论坛 (https://gm56.com/) Powered by Discuz! X3.5