Qwen

  • 2026.05.27 | youres | 12次围观
    Ollama低配电脑部署大模型实战:4GB内存也能跑起来
    为什么低配电脑也能部署大模型 很多人以为跑大模型必须要有高端显卡、32GB内存,其实不然。我用自己的老旧笔记本(i5-8265U + 8GB内存 + 无独立显卡)实测发现,借助Ollama的量化模型,4GB内存就能流畅运行7B参数级别的中文大模型。关键在于选对工具、选对模型版本、做好量化配置。 本文不是泛泛的"安装教程",而是我踩坑两周后的实战总结——哪些模型真正适合低配机器、量化参数怎么选、OOM崩溃怎么防,都有具体数据和解决方案。 Ollama是什么:一句话解释 Oll...
  • 2026.05.25 | youres | 10次围观
    本地大模型API调用实战:绕过云服务限制实现完全私有化的AI调用方案
    为什么我放弃了云端API,转向本地大模型调用 过去一年,我用过几乎所有主流的云端大模型API——OpenAI、Claude、豆包、DeepSeek。每次调用都要把数据传到第三方服务器,这对于处理敏感内容来说是个隐患。费用也不低,调用量上来后每月账单让人肉疼。 直到我发现了本地大模型API调用这条路,才发现:其实完全可以在自己电脑上跑一个媲美云端效果的模型,然后用标准REST API的方式调用它。 本地大模型API调用的核心原理 本质上,本地大模型API调用的架构非常清晰:...
  • 2026.05.18 | youres | 13次围观
    大模型LoRA微调实战教程:用消费级显卡训练你的专属AI模型
    为什么你需要自己微调大模型? 很多人觉得大模型微调是实验室里的事情,普通开发者根本碰不到。但事实是,2026年的今天,用一张RTX 4090甚至RTX 3090,你就能完成一个7B参数模型的LoRA微调。我亲手做过一个法律问答领域的微调,只用了8小时训练,效果比直接用GPT-4回答法律问题准确率高了23%。 微调的核心价值在于:让通用模型变成领域专家。你不需要从零训练一个模型,只需要在已有模型的基础上,用少量领域数据"点拨"它一下,它就能在你的专业领域表现得更出色。 LoR...
1