| 新盛公司游戏APP下载链接【xs10159.com 】腾龙公司游戏下载链接【xs10159.com】from transformers import AutoTokenizer, AutoModelForCausalLMmodel_path = "./qwen1.5-1.8b-chat" # 离线大模型的本地保存目录def local_model_summary(text: str, max_new_tokens=256) -> str: """ 国内常用的离线大模型有阿里Qwen、智谱GLM、深度求索DeepSeek、百度文心等等,以千问的文本大模型为例,又有Qwen1.5-1.8B-Chat和Qwen1.5-0.5B-Chat两种。 Qwen1.5是一系列不同大小的解码器语言模型,包括基础语言模型及其对齐的聊天模型。它基于Transformer架构,使用SwiGLU激活函数、注意力QKV偏置、组查询注意力、滑动窗口注意力与全注意力混合等技术。此外,Qwen1.5还提供了改进后适应多种自然语言和代码的分词器。 其中Qwen1.5-1.8B-Chat的模型页面为 https://modelscope.cn/models/Qwen/Qwen1.5-1.8B-Chat ,名称中的1.8B指的是18亿参数(1.8 Billion),模型文件大小为3.69GB。 Qwen1.5-0.5B-Chat的模型页面为 https://modelscope.cn/models/Qwen/Qwen1.5-0.5B-Chat ,名称中的0.5B指的是5亿参数(0.5 Billion),模型文件大小为1.25GB |
| 欢迎光临 五六论坛 (https://gm56.com/) | Powered by Discuz! X3.5 |