We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
文档
备案
控制台
登录
立即注册
首页
文章
问答
视频
活动
下载资源
团队号
镜像站
发布
AIGC 先锋科技
文章
专栏
问答
AIGC 先锋科技
Wi-Chat:首个基于LLM的 Wi-Fi 人体活动识别系统,开启零样本识别新范式!
AI
大模型
向量数据库
云通信
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群近年来,大语言模型(LLMs)在多种任务上展
9
0
0
0
AIGC 先锋科技
KAnoCLIP:借知识驱动 Prompt 学习,突破CLIP局限实现高效零样本异常检测 !
AI
大模型
向量数据库
数据中台
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群零样本异常检测(ZSAD)能够在不需要目标数
7
0
0
0
AIGC 先锋科技
ConsisLoRA:基于LoRA优化权重、多策略提升风格迁移内容与风格一致性 !
AI
大模型
向量数据库
机器学习
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群风格迁移涉及将参考图像的风格转移到目标图像的
5
0
0
0
AIGC 先锋科技
ShiftDC:破解视觉-语言模型安全感知失真,无训练提升安全对齐性能!
AI
大模型
向量数据库
云安全
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群近期的研究表明,集成视觉模态后的视觉-语言模
8
0
0
0
AIGC 先锋科技
SEM-CLIP:用于扫描电子显微镜图像中纳米级缺陷检测的精确少量学习 !
AI
大模型
向量数据库
数据中台
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群在集成电路制造领域,纳米级晶圆缺陷的检测与分
9
0
0
0
AIGC 先锋科技
SeNER:结合双向机制与 LogNScaling,轻量级 NER 技术高效提取长文本实体 !
AI
大模型
向量数据库
机器学习
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群命名实体识别(NER)是自然语言处理(NLP
15
0
0
0
AIGC 先锋科技
RELAY让循环 Transformer 助力CoT推理,微调自回归模型,实验证实效果显著提升!
AI
大模型
向量数据库
云通信
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群思维链(CoT) Prompt 已成为增强语言模型推理能力的一种强大技术。然而,生成长且正确的CoT轨迹颇具挑战。最近的研究表明,循环Transformer具有出色的长度泛化能力,但其有限的通用性和适应性阻碍了它们成为自回归解决方案的替代品。为了更好地利用循环Transformer的优势,作者提出了RELAY(通过循环对齐迭代推理)
8
0
0
0
AIGC 先锋科技
HumanDiT 姿势引导框架来袭,支持多分辨率,长序列视频生成精准又高保真 !
AI
大模型
云存储
容器
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群人类运动视频生成技术取得了显著进步,但现有方法在准确渲染细节部位如手和面部方面仍存在困难,尤其是在长序列和复杂动作中。当前的方法也依赖于固定的分辨率,难以保持视觉一致性。为了解决这些限制,作者提出了HumanDiT,这是一个基于Diffusion Transformer(DiT)的姿势引导框架,在包含1400小时高质量视频的大型且多
24
0
0
0
AIGC 先锋科技
HumanDiT姿势引导框架来袭,支持多分辨率,长序列视频生成更精准 !
AI
大模型
向量数据库
视频云
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群人类运动视频生成技术取得了显著进步,但现有方法在准确渲染细节部位如手和面部方面仍存在困难,尤其是在长序列和复杂动作中。当前的方法也依赖于固定的分辨率,难以保持视觉一致性。为了解决这些限制,作者提出了HumanDiT,这是一个基于Diffusion Transformer(DiT)的姿势引导框架,在包含1400小时高质量视频的大型且多
15
0
0
0
AIGC 先锋科技
MatIR 混合图像修复模型,融合 Transformer 与 Mamba 优势,实验验证显著成效 !
AI
向量数据库
大模型
数据中台
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群近年来,基于Transformer的模型通过利用其内在捕捉复杂上下文特征的能力,在图像修复领域取得了显著进展。近期,Mamba模型凭借其处理长程依赖的能力和相较于Transformer的显著计算效率,在计算机视觉领域引起了广泛关注。然而,Mamba在上下文学习能力方面目前落后于Transformer。为了克服这两种模型的局限性,作者
24
0
0
0
AIGC 先锋科技
MatIR:融合Mamba与 Transformer 的混合图像修复模型,实验验证其显著有效性!
AI
大模型
向量数据库
机器学习
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群近年来,基于Transformer的模型通过利用其内在捕捉复杂上下文特征的能力,在图像修复领域取得了显著进展。近期,Mamba模型凭借其处理长程依赖的能力和相较于Transformer的显著计算效率,在计算机视觉领域引起了广泛关注。然而,Mamba在上下文学习能力方面目前落后于Transformer。为了克服这两种模型的局限性,作者
32
0
0
0
AIGC 先锋科技
清华提出 2D 高斯扩散重塑图像分词,表达能力跃升驱动多模态进化!
AI
大模型
向量数据库
数据中台
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群本研究旨在探讨人工智能在医疗诊断领域的应用现状与发展趋势。通过对大量临床数据和现有算法的研究,本文分析了人工智能在疾病预测、辅助诊断和治疗方案优化等方面的优势与挑战。此外,本文还探讨了人工智能在医疗伦理、数据安全和隐私保护等方面的问题,以及未来发展趋势。有效的图像分词对于多模态理解和生成任务至关重要,因为其需要与离散文本数据进行对齐
34
0
0
0
AIGC 先锋科技
新颖故事化视频生成方法DreamRunner,性能超基线,多目标交互生成能力超绝!
AI
大模型
向量数据库
视频服务
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群最近,故事化视频生成(SVG)作为一种任务,旨在创建长、多动作、多场景视频,这些视频始终以输入文本脚本中描述的故事为主题。SVG在媒体和娱乐领域的多样化内容创作方面具有巨大潜力;然而,它也面临着巨大的挑战:(1) 目标必须表现出范围广泛的细微、复杂动作,(2) 多个目标需要在场景中一致出现,(3) 主题可能在同一场景中需要多个动作,
10
0
0
0
AIGC 先锋科技
CLIP-DQA:借助 CLIP 与层次信息,实现盲去雾图像质量精准预测 !
AI
向量数据库
大模型
云通信
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群摘要——盲去雾图像质量评估(BDQA),旨在在没有参考信息的情况下准确预测去雾图像的视觉质量,对于图像去雾算法的评价、比较和优化至关重要。现有的基于学习的BDQA方法取得了显著的成功,但DQA数据集的规模较小限制了它们的性能。为了解决这一问题,在本文中,作者提出将大规模图像-文本对预训练的对比语言-图像预训练(CLIP)应用于BDQ
34
0
0
0
AIGC 先锋科技
对比感知校准(CAC)多模态方法,为视觉语言模型开放词汇任务校准难题破局 !
云原生
向量数据库
大模型
云通信
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群视觉-语言模型(VLMs),如CLIP,已显示出卓越的泛化能力,并且可以通过 Prompt 微调快速适应下游任务。然而,在涉及非训练类别的分类任务中,即所谓的开放词汇设置,微调后的VLMs往往对训练类别过度拟合,导致置信度评分与未见类别实际准确度之间出现偏差,这在很大程度上削弱了它们在实际部署中的可靠性。现有的置信度校准方法通常需要
30
0
0
0
AIGC 先锋科技
轻量级MedMobile医学模型登场,38亿参数可移动运行,MedQA得分超医生及格线!
AI
大模型
向量数据库
机器学习
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群语言模型(LMs)在医学领域展示了专家级推理和记忆能力。然而,计算成本和隐私问题正在成为广泛实施的障碍。作者为医学应用引入了phi-3-mini的轻量级适应版MedMobile,这是一款38亿参数的模型,能够在移动设备上运行。作者证明,MedMobile在MedQA(USMLE)上得分为75.7%,超过医生的通过分数线(约60%),
10
0
0
0
AIGC 先锋科技
Mentor-KD 方法解决LLM推理蒸馏挑战,高效将多步推理能力灌输给小模型!
AI
大模型
向量数据库
数据中台
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群大型语言模型(LLMs)通过链式思维(CoT) Prompt 在各种复杂任务上表现出令人瞩目的性能。最近,有研究提出了知识蒸馏(KD)方法,即推理蒸馏,通过微调LLM教师生成的多步推理语言模型的语言模型,将LLM的推理能力进行传递。然而,他们没有充分考虑LLM教师模型中存在的两个挑战,即1)数据质量和2)软标签提供。在本文中,作者提
48
0
0
0
AIGC 先锋科技
VATT多模态框架实现可控视频到音频生成,凭音频字幕解锁新应用,性能远超现有方法 !
AI
大模型
向量数据库
视频服务
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群视觉和音频场景的内容是多维的,因此视频流可以与各种音频流配对,反之亦然。因此,在视频到音频生成任务中,引入控制生成音频的引导方法至关重要。虽然视频到音频生成是一个已经确立的生成任务,但现有方法缺乏这种可控性。在本工作中,作者提出了VATT,这是一个多模态生成框架,输入一个视频和一个可选的文本 Prompt ,生成音频和可选的音频文本
21
0
0
0
AIGC 先锋科技
惊爆!研究提出新颖框架,集成CLIP空间扩展预训练StyleGAN能力,文本引导操作灵活,性能远超现有方法 !
AI
大模型
向量数据库
数据中台
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群生成对抗网络(GANs),尤其是StyleGAN及其变体,在生成高度逼真的图像方面展现了惊人的能力。尽管它们取得了成功,但将这些模型适应到诸如域自适应、参考引导合成和文本引导操作等多样化任务,在有限训练数据的情况下仍然具有挑战性。为此,本研究中,作者提出了一种新颖的框架,通过超网络集成CLIP空间,显著扩展了预训练StyleGAN的
16
0
0
0
AIGC 先锋科技
新主动学习法LPLgrad来袭,少量标注提图像分类准确率,AI图像识别效率飙升!
AI
大模型
机器学习
算法
备注好友:方向-学校/公司-姓名/昵称【AIGC 先锋科技】交流群随着其在各个领域和任务中的出色表现和强大的泛化能力,机器学习模型越来越受到广泛的应用。然而,其成功与否取决于大量标注数据的可用性,而创建这些数据通常具有劳动密集、耗时和昂贵的特点。为了解决这些挑战,已经提出了许多主动学习(AL)方法,但它们往往无法充分利用AL的核心阶段的信息,例如在 Token 数据上训练和在 未标注 数据上 Qu
11
0
0
0