技术架构

kevi 如何工作

这个站点是面向招聘展示的 AI-native 作品集：内容保持事实源，RAG 检索证据，DeepSeek SSE 流式返回带引用回答。

RAGBGE 512pgvectorRedisDeepSeek SSE

RAG 流程

生成前先检索；站内事实没有可靠命中时不编造，通用问题会先标明范围再回答。

访客可以从 /chat、AI 抽屉，或文章/项目里的上下文询问入口发起问题。

Nitro API 先校验输入、检查 Redis 限流，并在任何 LLM 调用前对问题做 embedding。

Transformers.js 本地运行 Xenova/bge-small-zh-v1.5，并验证 BGE 向量为 512 维。

PostgreSQL pgvector 在已索引的文章、项目、个人资料和自定义 Q&A chunks 中检索 RAG 上下文。

DeepSeek SSE 通过站点 API 流式返回 delta，结构化引用来自检索到的 chunks。

MVP 优先选择更少的移动部件，让产品更容易验证和解释。

PostgreSQL 已经承载内容和元数据，所以 pgvector 让 MVP 保持一个数据库即可部署，避免引入 Pinecone、Milvus 或 Weaviate 的额外运维成本。

Docs-first 把范围决策显式化：路由命名、向量维度、SSE 事件和排除模块都先写入文档再实现。

Redis 限流在 embedding 和 LLM 调用之前执行，用来保护公开聊天入口的成本和延迟。

prompt injection 文本只作为用户内容处理；服务端系统规则和检索上下文始终是独立消息。