离线大模型的种类
📅 2026/6/28 18:33:40
👁️ 次浏览
下载离线大模型在下载离线大模型前要先在命令行执行下面的pip安装命令pip install modelscope接着命令行通过cd命令进入Python工程的所在目录再执行下面的模型下载命令modelscope download --model Qwen/Qwen1.5-1.8B-Chat --local_dir qwen1.5-1.8b-chat上面下载命令的“--model”参数表示离线大模型为“Qwen/Qwen1.5-1.8B-Chat”而“--local_dir”参数表示离线大模型的本地保存目录。注意Qwen1.5-1.8B-Chat的总大小为3.69GB下载过程较耗时请耐心等待。下载完毕即可在Python工程的目录下方找到qwen1.5-1.8b-chat文件夹里面保存的便是Qwen1.5-1.8B-Chat的具体模型文件。三、使用离线大模型输出摘要接下来演示如何使用Qwen1.5-1.8B-Chat对一段文本生成摘要。在编写Python代码前要先在命令行执行下面的pip安装命令pip install transformers然后编写下面的Python摘要测试代码from transformers import AutoTokenizer, AutoModelForCausalLM model_path ./qwen1.5-1.8b-chat # 离线大模型的本地保存目录 def local_model_summary(text: str, max_new_tokens256) - str: 加载本地离线模型 Qwen1.5-1.8B-Chat 做摘要 【无需联网、无需下载、纯本地运行】 # 加载本地分词器 本地模型完全离线 tokenizer AutoTokenizer.from_pretrained( model_path, trust_remote_codeTrue # Qwen 必须加这个 ) model AutoModelForCausalLM.from_pretrained( model_path, trust_remote_codeTrue, # Qwen 必须加这个 dtypeauto, device_mapauto ).eval() # 构造 Qwen1.5 官方对话格式 messages [ {role: system, content: 请对用户输入的内容做精简摘要摘要文字压缩在50字以内}, {role: user, content: text} ] # 官方模板构造 text_input tokenizer.apply_chat_template( messages, tokenizeFalse, add_generation_promptTrue ) inputs tokenizer( [text_input], return_tensorspt, truncationTrue ).to(model.device) # 离线生成摘要 outputs model.generate( **inputs, max_new_tokensmax_new_tokens, # 返回文本最多占用多少Token temperature0.3, top_p0.7, do_sampleTrue, pad_token_idtokenizer.eos_token_id ) # 提取摘要结果 response outputs[0][len(inputs[input_ids][0]):] summary tokenizer.decode(response, skip_special_tokensTrue) return summary.strip() if __name__ __main__: content 火山方舟是火山引擎推出的大模型平台提供模型训练、推理、评测、精调等全方位功能与服务。 平台支持多种主流大模型接入具有稳定可靠、安全互信的特点。 企业可以通过火山方舟快速构建自己的AI应用降低开发成本与技术门槛。 print(正在使用【本地离线模型】生成摘要...\n) result local_model_summary(content, max_new_tokens28) print(【离线摘要结果】) print(-, result)运行上面的Python代码输出日志结果如下
如何让老款iPhone重获新生?LeetDown降级工具完全指南 【免费下载链接】LeetDown a macOS app that downgrades A6 and A7 iDevices to OTA signed firmwares 项目地址: https://gitcode.com/gh_mirrors/le/LeetDown
想让你的老款iPhone 5、iPad 4等设备重新焕…
📅 2026/6/28 18:28:39
MoE 的核心思想传统 Transformer 中,每一层的 FFN 对所有 token 使用同一套参数进行计算,模型参数量与计算量严格线性绑定。MoE(Mixture of Experts,混合专家模型)的核心突破在于:将 FFN 替换为多个并行的&…
📅 2026/6/28 18:28:39
PhotoGIMP终极指南:3步让GIMP界面和Photoshop一模一样 【免费下载链接】PhotoGIMP A Patch for GIMP 3 for Photoshop Users 项目地址: https://gitcode.com/GitHub_Trending/ph/PhotoGIMP
还在为从Photoshop切换到GIMP而感到不适应吗?PhotoGIMP就…
📅 2026/6/28 18:28:39
150个Nuke插件终极指南:从零基础到专业合成的完整解决方案 【免费下载链接】NukeSurvivalToolkit_publicRelease public version of the nuke survival toolkit 项目地址: https://gitcode.com/gh_mirrors/nu/NukeSurvivalToolkit_publicRelease
你是否曾经在…
📅 2026/6/28 22:20:03
一、二叉树与哈夫曼树:层次化数据的高效处理(一)二叉树:基础数据结构的核心核心概念:二叉树是每个节点最多拥有两个子节点的树形结构,子节点区分为左子节点和右子节点,这种特性使其能高效表达层…
📅 2026/6/28 22:20:03
如何轻松转换网易云音乐NCM格式文件为通用MP3 【免费下载链接】ncmdump 项目地址: https://gitcode.com/gh_mirrors/ncmd/ncmdump
你是否曾经遇到过这样的情况:在网易云音乐下载了喜欢的歌曲,却发现只能在特定的应用里播放?想象一下&…
📅 2026/6/28 22:20:03
1. 为什么选择Hotswap Agent DCEVM替代Jrebel
每次修改Java代码后都要重启服务,这种开发体验实在太糟糕了。作为Java开发者,你一定用过或听说过Jrebel这个神器,它能实现真正的热部署,修改代码后立即生效。但每年550美元的个人订阅…
📅 2026/6/28 22:20:03
1. 从AST-2400到AST-2600:uboot固件更新的技术演进
第一次接触AST系列芯片的开发者,可能会对uboot环境下的固件更新感到困惑。特别是当项目需要从AST-2400迁移到AST-2600时,原有的操作方法突然不适用了。这就像你刚熟悉了手动挡汽车ÿ…
📅 2026/6/28 22:20:03
1. CQI与SINR:无线信道质量的"温度计"
想象一下你正在用手机看视频,突然画面开始卡顿——这时候你可能正在经历无线信道质量下降的问题。CQI(Channel Quality Indicator)就像是手机向基站发送的"质量报告单"&…
📅 2026/6/28 22:15:01
6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…
📅 2026/6/28 0:01:52
引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…
📅 2026/6/28 0:01:52
6个月前的2025年12月,Boris Cherny 公开宣布自己卸载了 IDE。一时间,Vibe Coding 成了全行业最热的话题。6个月后,当我们回过头来拉一份真实账本,发现事情远没有"一句话生成一个App"那么浪漫。本文从产品经理和研发两个…
📅 2026/6/28 0:01:52
引言:审计结束三个月了,审计员的权限还没关某城商行每年按照监管要求开展至少一次数据安全审计。审计期间,内审部门需要抽样检查各类业务数据——交易流水、客户信息、员工操作日志、权限配置记录。这些数据分布在不同系统中,审计…
📅 2026/6/28 0:01:52