登陆
首页
AI自动化
AI教程
服务器
留言本
登录
搜索
GGUF
AI教程
0
大模型INT4量化本地部署实战教程:让消费级显卡跑起百亿参数模型
2026.06.05 |
youres
| 26次围观
写在前面:为什么我折腾了大模型量化部署 三个月前,我尝试在一台只有RTX 3060(12GB显存)的电脑上跑Qwen2.5-72B,结果直接OOM(显存溢出)。后来我花了两周系统研究大模型量化技术,最终成功用INT4量化把这个72B模型塞进了12GB显存,推理速度还能维持在每秒15个token左右。今天这篇文章,就是把我踩过的坑和总结的经验一次性分享给你。 很多人对"量化"这个词有误解,以为就是把模型变糊了。恰恰相反,量化是大模型落地的必经之路,没有量化,绝大多数个人和企业...
AI教程
0
不用魔法的DeepSeek R1本地部署攻略:三步搞定纯中文环境AI大模型
2026.05.25 |
youres
| 30次围观
写在前面:为什么"不用魔法"突然成了刚需?2025年到2026年,DeepSeek R1几乎成了每个想入门大模型的人必聊的话题。但很多人卡在第一步:下载和运行它需要访问HuggingFace和Ollama官网,而在内地网络环境下,这些站点的下载速度经常只有几KB/s,甚至直接超时。本文的核心目标只有一个:让你在国内网络环境下,不借助任何魔法(VPN/代理),完整跑通DeepSeek R1。整个方案依赖三个在国内可以正常访问的工具:Microsoft Store、阿里云魔搭社区...
1
随机文章
OpenClaw飞书妙搭配置完整指南:5分钟搞定AI Agent部署
测试文章2
全面掌握OpenClaw教程中文:从零开始搭建智能工作流
HTTP/2 多路复用工作原理:让网站速度翻倍的核心技术
AI数字人直播搭建教程:从零打造24小时无人直播间的完整方案
Nginx \:从基础到实战技巧
PaddleOCR Python API调用实战:3行代码实现高精度文字识别
curl -w格式化输出详解:变量大全+6个实战场景,从此告别verbose翻找
URL重定向UTM参数传递机制详解:让流量追踪不再失效
最近发表
AI指纹解锁原理与安全风险分析:全面解读手机生物识别技术
AI数据标注工具推荐与使用方法:5款高效工具帮你快速完成标注任务
OCR 识别 教程:从零开始完整部署指南
AI合同审查工具推荐与使用方法:5款高效工具助你精准审查合同风险
AI配音工具推荐与使用方法:5款免费工具帮你轻松制作专业配音
AI图片放大工具推荐与使用方法:让你的模糊照片秒变高清
AI视频去重工具推荐与使用方法详解:从入门到批量处理
AI思维导图自动生成工具推荐:5款高效方案对比与实操教程
AI图片背景替换工具推荐与实用技巧详解
AI批量去水印工具推荐与实用方法详解
网站分类
AI自动化
AI教程
服务器
文章归档
2026年6月 (425)
2026年5月 (942)