We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
文档
备案
控制台
登录
立即注册
首页
文章
问答
视频
活动
下载资源
团队号
镜像站
发布
derrick.dy
文章
专栏
问答
derrick.dy
作为标注员的LLM(一)-- 蒸馏法
大模型
大模型
NoSQL数据库
机器学习
本系列第一期,介绍最简单、最直接的蒸馏法。
103
0
0
0
derrick.dy
自动优化Prompt:Automatic Prompt Engineering的3种方法
AI
大模型
关系型数据库
智能语音交互
“优化”这件事,机器+算法可以做的更好。
887
3
0
2
derrick.dy
Targeted Data Generation:半自动化的数据迭代框架,NLP模型迭代的新思路(ACL 2023)
AI
大模型
关系型数据库
机器学习
本期论文分享,介绍一种半自动化地迭代NLP模型的方法:Targeted Data Generation。
407
0
0
0
derrick.dy
作为标注员的LLM(五):三种标注范式以及思考
AI
大模型
机器学习
数据库
厘清不同范式的差异,有助于理解LLM标注的本质。
82
0
0
0
derrick.dy
无需标注即可Prompt Engineering:3种评估Prompt效果的无监督方法
云原生
大模型
云安全
机器学习
核心是利用无监督学习理论对Prompt进行效果评估。
44
0
0
0
derrick.dy
作为标注员的LLM(二):在弱监督学习的视角下
AI
大模型
云安全
机器学习
第二期,介绍另一种用LLM来标注的方法:多角度标注 + 弱监督学习法。
464
0
0
0
derrick.dy
ACL 2023 | 对验证集的一场重新审视 - 弱监督学习比你想象的更“弱”
大模型
大模型
机器学习
数据库
一次对验证集的重新审视,揭示了弱监督学习的真相 - 比你想象的更“弱”,大语言模型的研究者也需谨慎。
18
0
0
0
derrick.dy
AttrPrompt:让LLM生成的数据更加多样、更少Bias的一种思路
大模型
大模型
关系型数据库
直播
其本质是对文本分布的自然语言表征。
86
0
0
0
derrick.dy
作为标注员的LLM(四):开源大语言模型标注效果优化之Bias Calibration篇
AI
关系型数据库
数据安全
图像处理
引入Bias Calibration技术,Qwen-7B-Chat的Zero-Shot标注效果明显提升(+3%),但Few-Shot效果还有待进一步优化。
40
0
0
0
derrick.dy
作为标注员的LLM(三):中文开源LLM的标注效果初体验
AI
大模型
关系型数据库
微服务
系列第三期,在TNEWS数据集上,实地考察中文开源LLM的标注效果。
98
0
0
0
derrick.dy
LabelFast:基于LLM的NLP任务自动标注开源工具,Demo发布「AI小作坊」
AI
大模型
NoSQL数据库
机器学习
投放标注前,先用LabelFast,快速解决简单问题。
43
0
0
0
derrick.dy
自动Prompt Engineering(2):PE2、LongPO以及BPO
AI
大模型
机器学习
数据库
更新3篇工作,一个是横向研究、一个是纵向研究、一个是新方法。
68
0
0
0
derrick.dy
模型融合(Model Merging):合理性、常见技术及其特性
大模型
大模型
对参数进行合并,对标Multi Task Learning。
275
0
0
0
derrick.dy
DITTO:角色扮演的self-alignment方法
大模型
大模型
关系型数据库
智能语音交互
省钱,同时效果也不错。
168
0
0
0
derrick.dy
角色扮演论文浅读:RoleLLM、Character-LLM以及ChatHaruhi
AI
大模型
关系型数据库
智能语音交互
本文介绍角色扮演的技术实现、数据合成和效果评测方法。
249
0
0
0
derrick.dy
BGE论文解读:如何炼成中文世界的通用Embedding Model
AI
大模型
中文世界的Foundation Embedding Model。
484
0
0
0
derrick.dy
用GLM4做一款文字冒险游戏:「带娃路上的打怪升级」
AI
大模型
关系型数据库
云安全
开发一款文字冒险游戏的过程与感想。
27
0
0
0
derrick.dy
Large-Scale Weakly Supervision (Noisy) Data,何以成为大模型的数据基石?
大模型
大模型
机器学习
数据库
数据金矿的开采指南。
21
0
0
0
derrick.dy
Embedding技术的两个小应用:鲁迅全集检索 & 新闻早报聚类
AI
向量数据库
NoSQL数据库
关系型数据库
一边看论文,另一边也要动手实践。
96
0
0
0
derrick.dy
用AI来帮助AI:Detect Label Error with Cross Validation
AI
大模型
机器学习
数据库
AI是AI在scale路上的好帮手。
276
0
0
0