news 2026/1/18 11:24:22

基于ollama、llamafile部署的大模型使用

作者头像

张小明

前端开发工程师

1.2k 24
文章封面图
基于ollama、llamafile部署的大模型使用

一、ollama方式

1.本地部署ollama

部署方式:见本地部署ollama博客内容

2.基于langchain使用

from langchain_ollama.chat_models import ChatOllama llm = ChatOllama( model="deepseek-r1:8b", # 与本地 ollama run 的模型名保持一致 base_url="http://ip:11434", # 默认端口 temperature=0.1, num_predict=2048 ) # 单轮调用示例 for chunk in llm.stream( "你好" ): print(chunk.content)

二、llamafile方式

1.本地部署

步骤(linux环境)

wget https://huggingface.co/FM-1976/Qwen2.5-1.6b-llamafile/resolve/main/QwenPortable.llamafile chmod +x QwenPortable.llamafile ./QwenPortable.llamafile

2.基于langchain使用

from langchain_openai import ChatOpenAI # 配置本地模型:核心就是指向 llamafile 的 OpenAI兼容接口 llm = ChatOpenAI( base_url="http://ip:8080/v1", # 本地llamafile的API地址,固定 api_key="not-needed", # 必填但无效,随便填即可,llamafile不需要鉴权 model_name="not-needed", # 模型名随便填,不影响调用,llamafile会忽略 temperature=0.7, # 回答随机性,0=严谨,1=发散 max_tokens=128 # 最大生成字数 ) # 方式1:简单单轮对话 result = llm.invoke("你好") print(result.content)
版权声明: 本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若内容造成侵权/违法违规/事实不符,请联系邮箱:809451989@qq.com进行投诉反馈,一经查实,立即删除!
网站建设 2026/1/15 17:35:11

哪些类型的产品需要做 CCC 认证?

CCC 认证(中国强制性产品认证)的产品范围由国家市场监督管理总局、国家认监委动态调整,截至 2025 年 12 月,最新《强制性产品认证目录》涵盖16 大类核心产品,细分类别超过 100 种,均为与消费者人身安全、公…

作者头像 李华
网站建设 2026/1/15 17:33:02

手把手教你用7款AI写论文工具,精准控率无压力操作指南

还在为开题报告无从下笔而焦虑?或是被导师的修改意见搞得晕头转向?又或者,面对查重和AI检测率感到束手无策?别担心,你不是一个人在战斗。随着AI技术的飞速发展,一系列强大的AI论文写作工具应运而生&#xf…

作者头像 李华
网站建设 2026/1/17 13:27:55

【AI开发必备】Weaviate向量数据库让大模型秒懂人类语言!零代码小白也能部署的AI神器,附完整教程+实战案例!

向量数据库的出现,导致传统的搜索方式正在发生颠覆性的变化。现在,你通过浏览器搜索“舒适的阅读角”,不再只返回包含“舒适”和“角落”的文字结果,而是可以把跟“舒适的阅读角”相关的图片输出来了。 这种方法侧重于语义搜索&a…

作者头像 李华
网站建设 2026/1/16 19:13:02

用 XinServer 做后台运营平台的完整流程

用 XinServer 做后台运营平台的完整流程 最近好几个做前端的朋友跟我吐槽,说接了个外包项目,客户要一个带用户管理、内容发布、数据统计的完整后台。前端页面他们刷刷刷就搞定了,但一到后端和数据库就卡壳。要么得现学 Node.js Express&…

作者头像 李华