您现在的位置是:网站首页> AI人工智能
AI编程资讯
- AI人工智能
- 2024-08-29
- 329人已阅读
AI编程资讯
又一家国产厂商的大模型API官宣免费!还能免费微调
智谱AI大模型开放平台,点击进入平台
当然了,对于在深耕AI应用落地的开发者和企业来说,免费的通用大模型虽好,但离了微调环节依然用不起来。
毕竟模型的能力跟它训练阶段见过的数据依然是强关联的。如果模型没见过企业内部知识库、垂直场景的数据,那一定还是做不到实际可落地的效果的。
在一些强依赖模型微调的场景:
比如最简单的分类,在看似相同的分类任务上,不同的业务场景常常有不同的标准,必须通过微调来让模型学习个性化的分类标准。
再比如结构化输出,程序员都深知结构化输出有多香。某一个业务场景下就是需要某种格式的表格,比如银行里填表和工业检测里填表,就完全不一样。这里不仅包括解码阶段的语法规范,还常常涉及一些语义甚至业务逻辑层面的知识训练。要做到高可用性,微调是绕不开的。
再者还有现在企业都非常看重的行业知识、企业知识库,都是在互联网上不存在的数据,像销售话术、医疗诊断、端内数据,如果要在这些场景落地,模型要先微调学习相关的行业知识,才能更好的回答用户的问题。
工具API的调用同样是在互联网上不存在的知识,因此通用大模型往往在工具调用问题上表现的“很傻”,但其实通过少量的样本去微调一把,这种工具API调用的问题也能得到极大的改善。
从这个视角看,也不难理解为什么笔者说能傻瓜式免费微调是更大的爽点了吧!
毕竟如果你要自己微调模型,花钱买卡买机器还是小事儿,关键是软硬件环境的维护、专业人员的配置以及大模型备案等一系列的问题,都会让你觉得“这波创业简直是地狱级的难度”。
微调
1.进入智谱AI开放平台的模型微调页:
https://bigmodel.cn/console/modelft/finetuning
2.创建数据集
这里笔者把公众号近期的上百篇文章的后台数据给扒拉了下来,做成了json格式的数据集。
然后将数据集丢给智谱:
3.创建微调任务
配置好后,注意侧边栏的消费金额!
我们点击确认创建。就能在任务管理页看到任务进度啦!
由于数据量不多,加上我们选了LoRA微调,分钟级的就训练完了!
上一篇:优秀的开源项目
下一篇:玩转AI开源项目经验收集