云原生计算的个人主页 - 开发者社区

云原生计算

文章

专栏

问答

云原生计算

veDB-HTAP 论文入选 VLDB'25 | 字节跳动高度集成、高效执行&自适应的 HTAP（TP&AP 融合）系统

数据库关系型数据库数据库开发与运维

分享字节跳动数据库相关技术干货、实践、开发者及市场活动信息。

161

云原生计算

veDB-Search 实战：多路召回，文搜万物

数据库向量数据库关系型数据库推荐算法

分享字节跳动数据库相关技术干货、实践、开发者及市场活动信息。

云原生计算

火山引擎 MongoDB 进化史：从扛住抖音流量洪峰到 AI 数据底座

数据库向量数据库NoSQL数据库智能应用

分享字节跳动数据库相关技术干货、实践、开发者及市场活动信息。

云原生计算

5 倍性能优于开源版，火山 Milvus 集成 DiskANN+RaBitQ

数据库向量数据库企业应用人工智能与算法

分享字节跳动数据库相关技术干货、实践、开发者及市场活动信息。

279

云原生计算

veDB-Search：AI 混合检索，懂 SQL 就行

数据库关系型数据库向量数据库开发与运维

分享字节跳动数据库相关技术干货、实践、开发者及市场活动信息。

236

云原生计算

2025年，微服务架构和大模型能“玩出”什么新花样？

云原生大模型微服务数据库

2025 年开年，DeepSeek 开源模型以“低成本、高性能”成功掀起 AI 平价化浪潮，并以惊人的速度渗透至各个领域。在 AI 平价化浪潮的推动下，微服务架构正迎来前所未有的变革机遇。微服务架构通过将系统拆解为多个小型、独立的服务，每个服务运行在自己的进程中，负责特定的业务功能。与单体架构相比，微服务架构实现了更高的灵活性、可扩展性和可维护性，这些特性使其成为现代软件开发的首选。然而，随着企业

1116

云原生计算

云上统一监控：使用托管 Prometheus 实现云产品及业务观测

云原生容器服务数据库弹性计算

随着云计算的普及，上云成了众多企业的选择，上云后对云产品的运行状态、任务执行时延等方面的观测就成了使用的基础条件。火山引擎云监控已提供云产品基础观测的能力，但往往不同用户关注要点不同，对观测指标进行精细化的自定义查询及告警已成为一种更为广泛的使用趋势。火山引擎托管 Prometheus 服务（VMP）集成了诸多云产品开箱即用指标监控能力，针对典型的运维场景，提供了基于专家经验的预置大盘及预置告警

303

云原生计算

APMPlus 发布 HarmonyOS NEXT 鸿蒙系统 App 性能监控

云原生云原生可观测

新品发布：APMPlus 鸿蒙星河版APMPlus（火山引擎应用性能监控全链路版 App 监控）全新推出 HarmonyOS NEXT “鸿蒙星河版”App 性能监控服务，致力于为鸿蒙星河版 APP 用户提供优质的使用体验。我们积极携手鸿蒙星河版生态建设，更是荣幸地成为 DevEco Studio Partner SDK 专区首款 Performance Monitoring 类型 SDK。在此

492

云原生计算

使用火山引擎 APMPlus 优化 iOS 内存性能的全套指南

云原生中间件

前言本文面向 iOS 研发，不会涉及复杂的底层原理，而是直接告诉 iOS 研发答案，即怎么做，只需要花半小时阅读本文，就可以在开发需求的时候，知道如何更好利用内存来提升用户体验，同时避免稳定性相关问题给业务带来负向的用户体验；同时本文作者的初心是希望这篇文章能成为研发同学的一个“字典”，可以在一些特定场景或者感觉可能会踩内存坑的时候翻阅，快速找到最佳的编码规范。为什么需要合理使用内存资源在编程中有

197

云原生计算

字节跳动基础架构消息队列团队论文入选云计算领域顶会 SoCC 2024

云原生中间件

2024 年 11 月 20 日至 22 日，SoCC 2024 将在美国华盛顿州 Redmond 举行。字节跳动基础架构-消息队列团队的研究成果被 SoCC 2024 接收。SoCC 会议全称 Annual ACM Symposium on Cloud Computing，是云计算领域顶级会议之一，同时也是 ACM 所有会议当中唯一一个同时被 SIGMOD 和 SIGOPS 赞助的顶会。代表了当

441

云原生计算

数据库顶会 VLDB 2024 论文解读：字节跳动如何对大规模 Spark 作业进行资源提效

大数据大数据机器学习数据库

引言论文链接：https://www.vldb.org/pvldb/vol17/p3759-shi.pdf近年来 Spark 已经成为离线大数据处理引擎的事实标准，广泛用于数据仓库、数据湖、机器学习等领域。在字节跳动内部每天运行百万级别的 Spark 离线作业，Shuffle 量高达 500PB，CPU 资源需求达到千万级别。随着业务的快速发展，用户对计算资源的需求越来越大，除了增加物理资源之外，

571

云原生计算

火山引擎云搜索及消息队列 24 年 8 月产品动态

AI机器学习图像处理

模型更新说明【 Image Embedding 模型】在云搜索服务的 ML 服务中，支持创建 Image Embedding 模型。该模型是将图像转换为低维的向量表示，可以在各种机器学习任务中进行处理、分析和比较，快速搭建一套以图搜图和以文搜图的图文检索应用。Image Embedding 模型支持直接对图片和文字进行向量化，返回向量化结果。可以在相同 VPC 环境的 ECS 中，通过调用 I

461

云原生计算

数据库顶会 VLDB 2024 论文解读｜ResLake: 字节跳动多机房资源统一管理系统解析

云原生中间件

引言在字节跳动，每天有数百万的大数据作业在其全球的数十个数据中心运行。由于作业计算和存储资源的不匹配，存在将跨机房带宽用尽的风险，这会影响其他业务的运作，还会造成不同机房的资源负载不均衡。而且跨机房带宽存在成本高、延迟高、稳定性差等问题，会大幅增加作业的运行时长。为兼顾作业完成时间（Job Completion Time, JCT），并均衡不同机房之间资源的负载，字节跳动基础架构计算团队、存储团队

225

云原生计算

蜜度×火山云搜索：助力跨模态检索能力再升级

云原生中间件

在数字化浪潮汹涌的今天，信息的爆炸性增长与前所未有的多样性，对检索技术提出了更为严苛的挑战。近期，蜜度科技股份有限公司（以下简称“蜜度”）与北京火山引擎科技有限公司（以下简称“火山引擎”）进一步深化合作，双方强强联合，在跨模态检索领域实现再升级。通过引入火山引擎云搜索服务提供的搜索与向量引擎技术，助力蜜度的跨模态检索能力实现了质的飞跃。蜜度成立于 2009 年，是一家以人工智能技术为核心的语言智能

327

云原生计算

95% 向量资源节省，火山引擎云搜索 RAG 技术体系演进

云原生中间件

采访嘉宾 | 火山引擎云搜索团队鲁蕴铖、李杰辉、余炜强编辑 | Tina InfoQ2023 年，大模型惊艳了世界。2024 年，RAG 技术如日中天。RAG 使得大模型能够在不更新模型参数的情况下，获得必要的上下文信息，从而减少大模型的幻觉。随着大型语言模型技术的不断成熟和行业应用的深入，人们对 RAG 系统的期望已经超越了对其“酷炫”效果的追求。企业和组织开始寻找更可靠、可扩展的 RAG 解

117

云原生计算

基于火山引擎云搜索服务和豆包模型搭建 RAG 推理任务

云原生中间件

大语言模型（LLM，Large language model）作为新一轮科技产业革命的战略性技术，其核心能力在于深层语境解析与知识融合。在生成式人工智能方向主要用于图像生成、书写文稿、信息搜索等。当下的 LLM 模型是基于大量数据训练的，目的是让它们掌握广泛的普遍知识，这些知识被储存在它们神经网络的权重（也就是参数记忆）里。但是，如果我们要求 LLM 生成的回答涉及到它训练数据之外的知识，比如最新

837

云原生计算

火山引擎云搜索及消息队列 2024 年 7 月产品动态

云原生中间件

场景案例推荐【结合豆包模型搭建 RAG 推理任务】在云搜索服务的 ML 服务中，支持创建 RAG 深度学习模型，它结合了提取系统和生成模型的功能，可以在回答查询或生成文本时融合并利用大量外部信息源快速搭建一个 RAG 推理服务。查询流程中 RAG 应用会将用户输入的问题通过 Embedding 模型转化为向量，然后使用云搜索服务 OpenSearch 的混合查询功能查询问题向量和问题文本，召回 T

515

云原生计算

减少 95% 资源的向量搜索 | 使用云搜索的 DiskANN

云原生中间件

当前尖端的向量近邻搜索算法，主要以图搜索算法为主，此类算法为了能够最大化搜索的速度与准确度，需要将对应的索引结构和原始数据存放在内存中，显然这不仅大大提高了成本，还限制了数据集的大小。例如在当前主流的内存型 HNSW 算法下，业界常用的内存估算方式是：向量个数 * 4 * (向量维度 + 12) 。那么在 DEEP 10M（96维）的千万数据就需要内存达到 4GB 以上，但是通过 DiskA

1046

云原生计算

火山引擎云搜索服务通过信通院向量数据库可信认证

移动开发小程序云存储MySQL

17月16日，首届线下“可信数据库发展大会”在北京举办，会上中国信息通信研究院（中国信通院）公布了 2024 上半年“可信数据库”产品能力评测结果。火山引擎云搜索服务在基本功能、运维管理、安全性、兼容性、扩展性、高可用、工具生态方面满足测试要求，通过信通院向量数据库能力测评。此前，该产品也已经通过了中国信通院“ 可信数据库-搜索型数据库 ” 资质认证。“可信数据库”产品能力评测通过严

271

云原生计算

活动预告｜字节跳动大规模搜索技术应用实践分享

云原生中间件

在人工智能迅猛发展和数据要素市场化建设的浪潮下，为进一步推动全球数据库产业进步，由中国通信标准化协会、大数据技术标准推进委员会主办的“2024 可信数据库发展大会”将于 2024 年 7 月 16-17 日在北京线下举办。火山引擎云原生中间件团队受邀参与【搜索与分析型数据库 & 多模数据库】分论坛，资深架构师桂峰将带来《火山引擎云搜索服务大规模技术应用实践》主题演讲，与参会者共同探讨随着大

279