文档
备案
控制台
登录
立即注册
首页
AI 大模型体验中心
动手实验室
Agent 评测集
AI 案例广场
学习中心
社区
去发布
首页
AI 大模型体验中心
动手实验室
Agent 评测集
AI 案例广场
学习中心
社区
derrick.dy
文章
专栏
问答
derrick.dy
作为标注员的LLM(一)-- 蒸馏法
大模型
大模型
NoSQL数据库
机器学习
本系列第一期,介绍最简单、最直接的蒸馏法。
399
0
0
0
derrick.dy
自动优化Prompt:Automatic Prompt Engineering的3种方法
AI
大模型
关系型数据库
智能语音交互
“优化”这件事,机器+算法可以做的更好。
1778
3
0
2
derrick.dy
Targeted Data Generation:半自动化的数据迭代框架,NLP模型迭代的新思路(ACL 2023)
AI
大模型
关系型数据库
机器学习
本期论文分享,介绍一种半自动化地迭代NLP模型的方法:Targeted Data Generation。
577
0
0
0
derrick.dy
作为标注员的LLM(五):三种标注范式以及思考
AI
大模型
机器学习
数据库
厘清不同范式的差异,有助于理解LLM标注的本质。
365
0
0
0
derrick.dy
无需标注即可Prompt Engineering:3种评估Prompt效果的无监督方法
云原生
大模型
云安全
机器学习
核心是利用无监督学习理论对Prompt进行效果评估。
218
0
0
0
derrick.dy
作为标注员的LLM(二):在弱监督学习的视角下
AI
大模型
云安全
机器学习
第二期,介绍另一种用LLM来标注的方法:多角度标注 + 弱监督学习法。
782
0
0
0
derrick.dy
ACL 2023 | 对验证集的一场重新审视 - 弱监督学习比你想象的更“弱”
大模型
大模型
机器学习
数据库
一次对验证集的重新审视,揭示了弱监督学习的真相 - 比你想象的更“弱”,大语言模型的研究者也需谨慎。
68
0
0
0
derrick.dy
AttrPrompt:让LLM生成的数据更加多样、更少Bias的一种思路
大模型
大模型
关系型数据库
直播
其本质是对文本分布的自然语言表征。
383
0
0
0
derrick.dy
作为标注员的LLM(四):开源大语言模型标注效果优化之Bias Calibration篇
AI
关系型数据库
数据安全
图像处理
引入Bias Calibration技术,Qwen-7B-Chat的Zero-Shot标注效果明显提升(+3%),但Few-Shot效果还有待进一步优化。
176
0
0
0
derrick.dy
作为标注员的LLM(三):中文开源LLM的标注效果初体验
AI
大模型
关系型数据库
微服务
系列第三期,在TNEWS数据集上,实地考察中文开源LLM的标注效果。
354
0
0
0
derrick.dy
LabelFast:基于LLM的NLP任务自动标注开源工具,Demo发布「AI小作坊」
AI
大模型
NoSQL数据库
机器学习
投放标注前,先用LabelFast,快速解决简单问题。
352
0
0
0
derrick.dy
自动Prompt Engineering(2):PE2、LongPO以及BPO
AI
大模型
机器学习
数据库
更新3篇工作,一个是横向研究、一个是纵向研究、一个是新方法。
383
0
0
0
derrick.dy
模型融合(Model Merging):合理性、常见技术及其特性
大模型
大模型
对参数进行合并,对标Multi Task Learning。
825
0
0
0
derrick.dy
DITTO:角色扮演的self-alignment方法
大模型
大模型
关系型数据库
智能语音交互
省钱,同时效果也不错。
431
0
0
0
derrick.dy
角色扮演论文浅读:RoleLLM、Character-LLM以及ChatHaruhi
AI
大模型
关系型数据库
智能语音交互
本文介绍角色扮演的技术实现、数据合成和效果评测方法。
872
0
0
0
derrick.dy
BGE论文解读:如何炼成中文世界的通用Embedding Model
AI
大模型
中文世界的Foundation Embedding Model。
1764
0
0
0
derrick.dy
用GLM4做一款文字冒险游戏:「带娃路上的打怪升级」
AI
大模型
关系型数据库
云安全
开发一款文字冒险游戏的过程与感想。
492
0
0
0
derrick.dy
Large-Scale Weakly Supervision (Noisy) Data,何以成为大模型的数据基石?
大模型
大模型
机器学习
数据库
数据金矿的开采指南。
131
0
0
0
derrick.dy
Embedding技术的两个小应用:鲁迅全集检索 & 新闻早报聚类
AI
向量数据库
NoSQL数据库
关系型数据库
一边看论文,另一边也要动手实践。
245
0
0
0
derrick.dy
用AI来帮助AI:Detect Label Error with Cross Validation
AI
大模型
机器学习
数据库
AI是AI在scale路上的好帮手。
400
0
0
0