返回 / All projects
2023Data

金融数据管道

多源行情、报表、监管数据的清洗与编排

LIVE

在线体验

fin-data-pipeline · 清洗 / 校验(可编辑)
7
输入
6
输出
1
去重
13
规范化
7
错误
日期对手方金额币种流水号
2023-05-01某某贸易1200CNYTX001
2023-05-02Acme Corp¥2,400CNYTX002
nullBad Date Co500CNYTX003
2023-05-04null1OOOUSDTX004
nullNull Date ConullCNYTX005
2023-05-06Trailing Co1500CNYTX006
修正1·date规范化:「2023/05/01」→「2023-05-01」
修正1·counterparty规范化:「某某贸易」→「某某贸易」
修正1·amount规范化:「¥1200.00」→「1200」
修正1·currency规范化:「cny」→「CNY」
修正2·date规范化:「2023.5.2」→「2023-05-02」
错误2·amount无法解析金额 ¥2,400
20
我的角色
数据工程
年份
2023
团队
Natixis 团队
状态
原型 / Demo
01

项目概述

多源行情、报表与监管数据的清洗、校验与定时编排管道(Natixis 场景):3000+ 行自动化代码支撑日报与异常追踪,把人工操作减少约 20%。

02

问题

P01

多源数据格式不一、人工清洗易错,日报交付不稳定。

P02

缺少定时刷新与异常追踪,问题往往滞后发现。

03

架构与流程

architecture.diagram
STEP 01
多源接入

行情/报表/监管数据

STEP 02
清洗校验

格式统一与校验

STEP 03
特征工程

派生指标与口径

STEP 04
定时刷新

自动调度

STEP 05
交付

报表 / ML 下游

04

核心功能

VIEW 01

多源接入

统一接入异构数据源。

VIEW 02

清洗与校验

口径校验与异常提示。

VIEW 03

定时刷新

支撑稳定日报。

VIEW 04

异常追踪

问题及时暴露与回溯。

05

量化成果

3000+
自动化代码

端到端数据管道。

-20%
人工操作

减少约 20% 重复人工。

Daily
日报支撑

日报 + 异常追踪。

06

技术栈

PythonETLPandasSchedulingPower BI
下一个项目

高校数据看板