跳到主要内容
Vector Database

向量数据库原理与存储

向量数据库不只是“把 embedding 存起来”。它还需要记录 metadata、建立索引,并在查询时做近邻搜索。

Vector Database
返回原理演示
查看产品

写入文档

向量表示

dim 10.32
dim 20.39
dim 30.63
dim 40.98
dim 50.80
dim 60.92
dim 70.89
dim 80.68

存储记录

id: vec_5957

collection: contracts_knowledge

title: 合同续签

source: 制度库/合同管理规范

tags: 合, 同, 续, 签, 审

索引结构

通过图结构快速跳到近邻区域,是在线检索里最常见的选择。

Latency: 快Recall: 高

近邻检索结果

查询请求

查询:合同续签需要哪些材料?

合同续签审批材料

0.94

法务复核要求

0.82

归档规范

0.66

推荐下一步

推荐下一步

继续沿着相关主题看下去,会更容易把概念和工程实现串起来。

Query -> Retrieve -> Rerank -> Context -> Generate
入门

RAG 检索增强生成 🔥

演示查询改写、召回、重排、拼接上下文与最终生成的完整流程。

适合知识库客户、售前沟通

打开演示
Text -> Vector -> Similarity -> Clusters
入门

Embedding 向量空间

通过二维示意和相似度说明文本如何落入向量空间。

适合初次接触知识库的用户

打开演示
Document -> Chunk -> Embed -> Retrieve
进阶

RAG 分块 Chunking 演示

对比大块、适中、小块切分对召回命中的影响,理解为什么 chunk 大小会改变答案质量。

适合知识库、RAG、搜索项目

打开演示