EdgeVec：浏览器原生向量数据库，让AI应用彻底摆脱服务器 - 文章 - 开发者社区

在浏览器中做向量检索，一直是个麻烦事。原生的IndexDB并不支持向量。之前笔者使用过pglite方案，完成浏览器内的向量检索及问答。我已经将它做为一款书签/桌面/资讯于一体的chrome插件，感兴趣的朋友可以下载使用。

picture.image

https://chromewebstore.google.com/detail/memwink/mpklgnebhehdpdpddabokaocemmalijn?hl=zh-CN&utm\_source=ext\_sidebar

今天，我要再介绍一个原生解决浏览器向量检索的开源产品EdgeVec。它是一个完全运行在浏览器中的向量数据库，通过WebAssembly实现，导入即用，无需任何外部依赖。

picture.image

EdgeVec把完整的向量数据库能力直接搬到浏览器里。所有计算在本地完成，数据不出设备，同时提供企业级的功能特性。

核心特性

零配置部署

像使用普通npm包一样简单，无需Docker、服务器或任何配置文件。一行import，立即可用。

极致内存优化

通过二值量化技术，将向量存储空间压缩32倍。100万个768维向量从300MB压缩到10MB，让浏览器也能处理大规模数据。

硬件加速

利用WebAssembly SIMD指令，向量运算速度提升2-8倍。在支持SIMD的浏览器中（Chrome 91+、Firefox 89+、Safari 16.4+），汉明距离计算可达8.75倍加速。

完整数据库功能

元数据过滤 ：支持SQL风格的过滤表达式
软删除 ：O(1)删除操作，支持压缩回收空间
持久化存储 ：数据可保存到IndexedDB
内存监控 ：实时监控WASM堆使用情况

性能表现

768维向量搜索测试（M1 MacBook）：

| 规模 | 搜索延迟 | 内存占用 | | --- | --- | --- | | 1万向量 | 380µs | 30MB | | 10万向量 | 938µs | 300MB | | 二值量化模式 | <500µs | 10MB |

距离计算性能：

点积运算：374ns（2.1 Gelem/s吞吐量）
汉明距离：4.5ns（40 GiB/s吞吐量）

快速上手

  
npm install edgevec

  
import init, { EdgeVec } from 'edgevec';  
import { pipeline } from '@xenova/transformers';  
  
// 初始化  
await init();  
const embedder = await pipeline('feature-extraction', 'Xenova/all-MiniLM-L6-v2');  
const db = new EdgeVec({ dimensions: 384 });  
  
// 添加向量  
const embedding = await embedder(text, { pooling: 'mean', normalize: true });  
db.insertWithMetadata(new Float32Array(embedding.data), {  
    category: "document",  
    timestamp: Date.now()  
});  
  
// 搜索  
const results = db.searchWithFilter(  
    queryVector,   
    'category = "document"',   
    10  
);  
  
// 持久化  
await db.save("my-vector-db");

技术对比

| 方案 | EdgeVec | PGlite+pgvector | hnswlib-wasm | Pinecone | | --- | --- | --- | --- | --- | | 部署复杂度 | 零配置 | 需要配置 | 零配置 | 需要API | | 二值量化 | ✓(32x) | ✗ | ✗ | ✗ | | 元数据过滤 | ✓ | ✓ | ✗ | ✓ | | 离线运行 | ✓ | ✓ | ✓ | ✗ | | 包体积 | 217KB | ~3MB | ~100KB | N/A | | 数据隐私 | 完全本地 | 完全本地 | 完全本地 | 云端处理 |

EdgeVec专为向量搜索场景优化，在保持轻量级的同时提供企业级功能。