企业智能化技术能力图谱

ARCHITECTURE

六层技术架构

自底向上，从数字化转型方法论到智能应用层，构建完整的企业智能化技术支撑体系。

智能应用层

智能问数 · 政策问答 · 智能报告 · 辅助决策 · 数字员工

AI 工程层

提示词工程 · RAG 检索增强 · 上下文工程 · 模型微调 · Agent 编排

算法与模型层

CNN / RNN / LSTM · Transformer / BERT · LLM · PyTorch · Ollama / vLLM

大数据层

ETL 与调度 · 离线计算 · 数据仓库 · 数据中台 · BI 与可视化

云原生基础设施层

Spring Cloud Alibaba · Docker · Kubernetes · 微服务治理 · CI/CD 流水线

数字化转型方法论

流程架构梳理 · 业务对象建模 · 数字化转型一张图

LAYER 1 · 云原生基础设施

一切智能化的底座

解决"系统怎么跑、怎么部署、怎么扩展"的问题。

微服务架构

Spring Cloud Alibaba

Nacos 注册/配置中心、Sentinel 流控熔断、Seata 分布式事务、Gateway 网关

Spring Boot

微服务基础框架，约定优于配置，快速构建生产级应用

RocketMQ / Kafka

异步消息中间件，解耦服务、削峰填谷

容器化与编排

Docker

容器化标准，一次构建，到处运行

Kubernetes (K8s)

容器编排引擎，自动化部署、扩缩容、滚动更新

Helm

K8s 应用包管理，标准化部署模板

DevOps 与持续交付

GitLab

代码管理与 CI/CD 流水线引擎

Jenkins

自动化构建与持续集成引擎

Prometheus

时序监控数据采集与告警

Grafana

可视化监控仪表盘，保障服务可观测性

DevOps 流水线

代码提交

→

自动构建

→

自动测试

→

镜像打包

→

K8s 部署

→

监控告警

LAYER 2 · 大数据体系

数据怎么采、怎么存、怎么算、怎么用

从数据源到 BI 看板，构建完整的数据价值链。

数据采集与集成

Flink CDC

实时变更数据捕获，毫秒级感知源端数据变化

DataX

阿里开源离线批量数据同步工具

⏱

DolphinScheduler / Airflow

调度引擎，定时编排 ETL 任务

数据存储与计算

Hive

基于 Hadoop 的数据仓库，面向批量 SQL 分析

Spark

大规模分布式计算引擎，T+1 批量分析

Flink

流批一体计算引擎，秒级实时流数据

⚡

ClickHouse / Doris / StarRocks

OLAP 分析引擎，高并发多维分析

数据仓库分层架构

ODS

操作数据层

原始数据落地，保持与源系统一致

DWD

明细数据层

清洗、标准化、去重后的明细事实数据

DWS

汇总数据层

按主题域聚合的轻度汇总数据

ADS

应用数据层

面向报表、接口、应用的最终结果

数据中台与治理

🏛

数据中台

统一数据资产管理，避免烟囱式重复建设

🔑

主数据管理 (MDM)

统一组织、人员、物料等核心数据标准

✅

数据质量管理

完整性、一致性、准确性、及时性四维校验

🔗

数据血缘与目录

追踪数据全链路，支撑影响分析

大数据全链路

数据源

→

ETL 采集

→

数据仓库

→

OLAP 引擎

→

BI 看板

数据 API → 智能应用

LAYER 3 · 算法与模型基础

AI 底层是怎么工作的

理解这些概念，才能做出正确的技术决策。

核心算法架构

算法	类型	适用场景
CNN	卷积神经网络	图像识别、缺陷检测、OCR 文字识别
RNN	循环神经网络	时序数据、语音识别（已逐步被 Transformer 替代）
LSTM	长短期记忆网络	长序列建模、设备故障预测、工时预测
Transformer	自注意力架构	当前 AI 核心架构，NLP / 多模态 / 代码生成
BERT	双向编码器	文本分类、语义理解、命名实体识别
GPT 系列	自回归解码器	文本生成、对话、代码生成、推理

训练与推理工具链

PyTorch

最主流的深度学习框架，学术界和工业界首选

Ollama

本地化大模型运行，一键部署 Llama / Qwen / DeepSeek

🚀

vLLM

高性能推理引擎，PagedAttention 大幅提升吞吐

OpenAI GPT

GPT-4 / GPT-4o 商业大模型，对话推理多模态标杆

Hugging Face

模型仓库与工具链生态，Transformers / PEFT

AI 关键概念速查表

概念	一句话解释
Token 化	将文本拆分为模型能理解的最小单元（字/词/子词），是所有 NLP 任务的第一步
Embedding	将 Token 映射为高维向量，语义相近的词向量距离近
Encoder	编码器，将输入压缩为语义表示（理解输入）；BERT 是典型 Encoder
Decoder	解码器，基于语义表示逐步生成输出；GPT 是典型 Decoder
向量化	将非结构化数据转换为数值向量，是检索和相似度计算的基础
张量 Tensor	多维数组，深度学习数据流转的基本单位（标量→向量→矩阵→张量）
梯度下降	模型训练核心算法——沿"损失最快减小"方向更新参数
损失函数 Loss	衡量预测值与真实值差距，训练目标是最小化它
注意力机制	让模型"关注"输入中最重要的部分，Transformer 的核心创新
幻觉 Hallucination	模型生成看似合理但不存在的信息，LLM 应用中必须解决的问题

LAYER 4 · AI 工程体系

连接算法与业务的关键一层

解决"AI 怎么用到企业实际业务中"的问题。

提示词工程 Prompt Engineering

🎯

System Prompt

设定 AI 的角色、行为边界和输出格式

📝

Few-shot / Zero-shot

通过给出示例引导模型输出

🧠

Chain of Thought

让模型分步思考，提升复杂推理准确率

{ }

结构化输出

约束输出 JSON / 表格，便于程序解析

检索增强生成 RAG

🔍

RAG

先检索相关知识，再基于检索结果生成回答

📦

向量数据库

Milvus / Chroma / FAISS，语义相似度检索

✂️

文档切片

按语义切分长文档，独立向量化

🕸

GraphRAG

引入知识图谱，增强实体关系推理

🏆

Reranker

对检索结果二次排序，提升上下文质量

上下文工程 Context Engineering

📐

上下文窗口

模型单次能处理的最大 Token 数量

🗜

上下文压缩

摘要或筛选，在有限窗口内塞入最有价值的信息

💾

记忆管理

短期记忆 + 长期记忆，让 AI 具备"记住"的能力

🧩

动态上下文组装

实时拼装 Prompt + 检索结果 + 历史对话

模型微调 Fine-tuning

🔧

全量微调

更新全部参数，效果好但成本高

⚡

LoRA / QLoRA

低秩适配，只训练少量参数，大幅降低成本

📊

SFT 监督微调

用"问答对"数据训练模型

👍

RLHF / DPO

基于人类反馈，让输出更符合预期

Agent 智能体编排

🤖

Agent

具备感知、推理、行动能力，自主调用工具完成任务

🔌

Tool Use

调用外部 API、数据库、代码执行器

👥

Multi-Agent

多个 Agent 协作，各司其职

🔄

Workflow 编排

按流程串联 Agent，形成自动化业务流

AI 工程处理链路

用户提问

→

意图识别

→

知识检索

→

上下文组装

→

模型推理

→

Agent 调用

→

结果生成

LAYER 5 · 智能应用层

AI 能力的业务落地

将底层算法、工程能力转化为可感知的业务价值，让每个岗位都能触达智能。

五大核心应用方向

📊

智能问数

自然语言查询结构化数据，用"说人话"的方式获取经营指标与统计报表

💬

知识问答

基于 RAG 的企业知识库问答，覆盖制度、流程、通知等非结构化文档

📝

智能报告

自动生成经营分析报告、人才盘点报告、项目周报等，数据驱动内容生成

🧭

辅助决策

基于数据分析与模型预测，为管理者提供招聘预测、离职预警、编制优化等决策建议

🤖

数字员工

7×24 小时在线的智能体，自主完成数据录入、流程审批、通知推送等重复性工作

首批标杆场景（点亮工程）

📖

制度问答助手

员工随时查询公司制度、政策解读，RAG + 知识库驱动，秒级响应

📢

通知问答助手

自动解析通知公告，回答"什么时候放假""报销标准是多少"等高频问题

🔢

智能问数（HR）

"在岗人数多少""离职率趋势"——自然语言直达数据，无需等报表

🏷️

自动打标助手

对简历、培训记录、绩效评语等文本自动提取关键标签，辅助人才画像建设

应用落地的三个技术关键

关键问题	说明	解决方向
私有化数据理解	让模型理解公司内部数据、制度和业务术语	RAG 检索增强、企业知识库、本体论建模
降低幻觉	减少 AI 编造不存在的信息，确保输出可信	知识溯源、置信度评估、人工审核闭环
实时数据接入	突破预训练的时间限制，让模型了解最新数据	实时数据管道、动态知识更新、Tool Use

业务对练机制

AI 输出结果

→

业务专家评审

→

标注反馈数据

→

模型优化迭代

→

持续循环 ↺

智能应用全链路

业务场景识别

→

数据准备

→

知识库构建

→

AI 能力编排

→

应用交付

→

业务对练

→

持续优化

LAYER 0 · 数字化转型方法论

技术是手段，转型是目的

没有方法论指导，技术再强也容易"建了一堆系统，业务没有变化"。

流程架构梳理

战略目标

→

价值链分析

→

一级流程域

→

二级流程组

→

三级流程活动

→

数字化触点

→

系统功能映射

层级	说明	示例
一级流程域	企业价值链的核心环节	研发、采购、制造、销售、HR、财务
二级流程组	每个环节下的主要流程	HR → 招聘管理、薪酬管理、绩效管理
三级流程活动	具体可执行的操作步骤	招聘管理 → 需求提报 → 简历筛选 → 面试安排
数字化触点	流程中可被系统承载的关键节点	简历筛选 → AI 智能筛选

业务对象建模

业务对象：组织、人员、岗位、物料、订单、设备等核心实体
对象关系：人员→归属→组织，订单→包含→物料
主数据：跨系统共享的核心数据，数据治理第一优先级
数据标准：统一编码规则、字段定义，确保全公司说法一致

数字化转型一张图

战略层：企业战略目标 → 数字化转型愿景
业务层：流程架构梳理 → 业务对象建模 → 场景优先级
数据层：主数据治理 → 数据仓库与中台 → 数据质量
技术层：云原生 → 大数据 → AI 工程
应用层：核心业务系统 → 智能应用 → 数字员工
组织层：数字化人才 → 变革管理 → 持续运营

PANORAMA

技术栈全景速查

一目了然，快速定位每个领域的核心技术。

云原生与中间件

Spring Cloud Alibaba, Docker, Kubernetes, Helm, Harbor, CI/CD, RocketMQ, Kafka

大数据

ETL, DolphinScheduler, Hive, Spark, Flink, ClickHouse, 数据中台

AI 工程

Prompt Engineering, RAG, GraphRAG, Context Engineering, Fine-tuning, Agent

算法模型

CNN, RNN, LSTM, Transformer, BERT, GPT, PyTorch, Ollama, vLLM

监控运维

Prometheus, Grafana, GitLab, Jenkins

智能应用

📊 💬 📝 🧭 🤖

智能问数, 知识问答, 智能报告, 辅助决策, 数字员工, 业务对练