We're sorry but react app doesn't work properly without JavaScript enabled. Please enable it to continue.
文档
备案
控制台
登录
立即注册
首页
文章
问答
视频
活动
下载资源
团队号
镜像站
发布
慢慢学 AIGC
文章
专栏
问答
慢慢学 AIGC
探索 M4 Max 在大模型上的性能
大模型
大模型
Apple 刚刚推出了全新的 MacBook Pro,声称其配备的 128 GB 显存和全新 M4 Max 芯片“能够轻松处理拥有 2000 亿参数的大模型”。
7
0
0
0
慢慢学 AIGC
VLM:计算机视觉模型的未来
AI
图像处理
大数据
关系型数据库
本文讨论视觉语言模型(VLM),解释开发多模态神经网络用于图像搜索的基础知识和训练过程,探讨其设计原则、挑战和架构。展示如何使用支持 AI 的搜索产品来处理图像和文本,以及引入 VLM 后的收益。
59
0
0
0
慢慢学 AIGC
ARIA : 开源多模态原生 MoE 模型
AI
大模型
智能应用
数据库
ARIA 开放的多模态原生 MoE 模型,在各种多模态、语言和编码任务中表现一流。ARIA 对每个视觉和文本 token 分别激活了 39 亿和 35 亿个参数。它在多模态任务上超越了 Pixtral-12B 和 Llama3.2-11B。
24
0
0
0
慢慢学 AIGC
看不见的芯片游击战:过去两年中国公司如何规避美国制裁
AI
大模型
数据库
机器学习
为应对美国的限制,华为开启了一个由政府支持的大规模发展项目,旨在建立国内半导体供应链。通过并购和创业,华为现已控制了涵盖晶圆制造材料、设备、光学、芯片制造(专用、存储器和先进逻辑)和芯片设计的公司。这些努力涵盖了整个AI和移动生态系统。
373
0
0
0
慢慢学 AIGC
AI 新云操作指南与架构分析【技术篇】
AI
GPU
NoSQL数据库
云安全
AI 新云是专注于提供 GPU 计算租赁的新型云计算服务提供商。本文我们将揭开运行新云的各个层面,包括如何制定集群物料清单 (BoM)、应对部署、资金和日常运营的复杂性。我们还将提供关于 BoM 和集群架构的几项重要建议。
31
0
0
0
慢慢学 AIGC
OpenAI o1 有多强?我们用逻辑推理,24 点,中国象棋和《黑神话》来评测下
AI
大模型
关系型数据库
智能语音交互
通过本文几个任务实测,我们体验了 OpenAI o1 强大的推理能力,其思考过程也向我们揭示了更多模型生成答案过程的细节。尽管 o1 还存在一些不足,相信在不久的将来会一一克服。
25
0
0
0
慢慢学 AIGC
运用知识蒸馏(KD)构建小语言模型
技术
火山方舟
向量数据库
大模型
本文将探讨RAG的一些常见缺陷,语言模型微调的挑战,并概述知识蒸馏(KD)的基本概念,同时提供一个实际示例来说明其应用。
84
0
0
0
慢慢学 AIGC
介绍一款强大的文本到视频生成工具
开源
视频云
小程序
短视频平台上随手一搜“AI 视频”,迎面而来的各类精美作品甚至能以假乱真,让你置身赛博空间无法自拔。很多小伙伴会问,这些博主都是用什么工具制作的 AI 视频?是否收费?是否需要排队内测?步骤是不是很麻烦?生成次数有没有限制?本文为你揭晓
38
0
0
0
慢慢学 AIGC
RLHF 的故事:起源、动机、技术和现代应用
技术
技术
这篇文章深入探讨了RLHF(基于人类反馈的强化学习)的起源、动机、技术和应用,以及它如何彻底改变了生成式语言模型的训练方法。文章强调了RLHF相比传统有监督学习方法的优势,特别是在解决训练目标与实际期望输出之间不一致问题方面的作用。
553
0
0
1
慢慢学 AIGC
谁在用生成式 AI 赚钱?
AI
智能内容
数据迁移与工具
MySQL
细数那些在生成式浪潮中赚到钱的公司
24
0
0
0
慢慢学 AIGC
解密 LLM 扩展定律
技术
技术
文章涵盖了 LLMs 的各种扩展定律,研究了模型的损失如何随着训练数据和参数数量的增加而变化。讨论包括对用于解释 LLM 扩展定律的等损失等高线和等 FLOP 切片的解释,提供了关于优化计算资源的见解。
37
0
0
0
慢慢学 AIGC
为什么大多数 LLM 都是仅解码器架构
大模型
火山方舟
向量数据库
智能应用
仅解码器架构的流行来自于其简单性、良好的零样本泛化能力,以及较低的训练成本就能达到合理的性能。编码器组件通过能够从非文本输入中提取信息来支持"内置多模态性",这可能对未来一代 LLM 至关重要。
128
0
0
0
慢慢学 AIGC
图解 CLIP 计算过程
AI
向量数据库
人工智能与算法
微服务治理
点击下方 卡片 ,关注“ 慢慢学AIGC ”徒手计算 CLIP ✍️对比语言-图像预训练模型(Contrastive Language–Image Pre-training,简称 CLIP)是 OpenAI 的一项开创性工作,重新定义了计算机视觉和自然语言处理的交集。 它是我们今天看到的所有多模态基础模型的基础。CLIP 模型的目标是学习一个文本和图像的共享嵌入空间。CLIP 是如何计算的呢?下面
31
0
0
0
慢慢学 AIGC
TensorFlow 中的 bfloat16 数据类型
技术
火山方舟
向量数据库
大模型
bfloat16 不是 float16,但数值范围上更胜一筹
27
0
0
0
慢慢学 AIGC
COMPUTEX 2024 有哪些看点
技术
技术
英伟达市值巅峰,谱写了怎样的传奇故事,让我们拭目以待
13
0
0
0
慢慢学 AIGC
TensorFlow 模型剪枝方法
边缘云
火山方舟
向量数据库
大模型
模型剪枝(Model Pruning)是一种模型压缩方法,对深度神经网络的稠密连接引入稀疏性,通过将“不重要”的权值直接置零来减少非零权值数量,其历史可追溯到上世纪 90 年代初。
15
0
0
0
慢慢学 AIGC
Nvidia Jetson Nano 初体验
移动开发
人工智能与算法
增长营销
数据中台
Nvidia 推出价格仅 99$ 的 Jetson Nano,本文将介绍如何开始使用它,包括首次启动,安装系统软件包,配置 Python 开发环境,安装 Keras 和 TensorFlow,修改默认相机,以及运行分类和目标检测任务。
53
0
0
0
慢慢学 AIGC
TensorFlow XLA 学习笔记(二):完整运行过程
技术
人工智能与算法
增长营销
数据库管理服务
本篇继续深入探索 XLA 具体做了哪些事情。
20
0
0
0
慢慢学 AIGC
DQN 原理(三):DQN 训练代码实现
云原生
火山方舟
向量数据库
接着上文,我们看下代码实现。首先看 Q-Network 和 Target Q-Network 构建过程:de
26
0
0
0
慢慢学 AIGC
通俗解释专家混合(MoE)架构
云原生
大模型
智能语音交互
机器学习
专家混合(MoE)模型是一类 Transformer 模型。与传统的密集模型不同,MoE 采用“稀疏”方法,其中每个输入仅使用模型的部分组件(即“专家”)。这种设置允许更高效的预训练和更快的推理,同时管理更大的模型规模。
16
0
0
0