← 返回项目列表
RAG 检索增强大语言模型Python数据分析风险分析

金融文档 RAG 智能问答系统

面向金融监管文档(PBOC/SAFE法规)构建的 RAG 检索增强问答系统,支持自然语言合规查询并输出带来源引用的精准答案,帮助合规团队快速定位政策依据。

9 分钟阅读
含交互演示
5 个技术标签

项目概述

本项目为金融机构合规团队设计,将人民银行、外汇局等监管部门发布的法规文件转化为可检索的知识库。通过 RAG 架构,用户可用自然语言提问(如「非银支付机构的备付金管理要求是什么」),系统自动检索相关法规段落并由 LLM 综合生成答案,附带原文引用链接。

核心功能

01

混合检索策略:BM25 稀疏检索 + 向量密集检索(双路召回),显著提升复杂法规查询的相关性

02

智能分块:按法规条款边界切割,保留条文语义完整性,避免跨条截断导致的语义丢失

03

LLM 综合答案:检索段落送入大模型,生成连贯解释并标注每个论断的来源条款

04

引用溯源:每条答案附带引用的法规名称、条款编号和原文摘录,支持快速核验

05

多文档联合检索:支持同时检索多部法规,自动处理法规间的交叉引用关系

技术方法

系统架构采用 LangChain + ChromaDB 向量库。文档预处理阶段按监管条款边界切块(chunk_size=512,overlap=64);检索阶段融合 BM25 与 text-embedding-3-small 向量得分(权重 0.3:0.7);生成阶段使用 GPT-4o 输出结构化 JSON,包含 answer、sources、confidence 三个字段,前端据此渲染引用卡片。

技术栈

RAG 检索增强RAG
大语言模型LLM
PythonPY
数据分析DA
风险分析RISK

项目信息

阅读时长9 分钟
交互演示可体验
重点项目Yes
技术标签5
← 返回项目列表
交互演示

RAG 智能问答演示

在此体验完整的混合检索流水线,实时检索 11 条监管法规并生成带引用的答案。

RAG · 混合检索演示

金融法规智能问答

BM25 + 向量密集检索 · 11 条监管法规 · 实时检索 + 引用生成

11

docs