全栈技术体系 · 技术沉淀

企业智能化
技术能力图谱

从云原生基础设施到 AI 智能应用,六层架构支撑企业智能化全链路。

编制人:钟宏远 · 数字化咨询 高级专家

探索技术栈
SCROLL
六层技术架构
自底向上,从数字化转型方法论到智能应用层,构建完整的企业智能化技术支撑体系。
L5

智能应用层

智能问数 · 政策问答 · 智能报告 · 辅助决策 · 数字员工

L4

AI 工程层

提示词工程 · RAG 检索增强 · 上下文工程 · 模型微调 · Agent 编排

L3

算法与模型层

CNN / RNN / LSTM · Transformer / BERT · LLM · PyTorch · Ollama / vLLM

L2

大数据层

ETL 与调度 · 离线计算 · 数据仓库 · 数据中台 · BI 与可视化

L1

云原生基础设施层

Spring Cloud Alibaba · Docker · Kubernetes · 微服务治理 · CI/CD 流水线

L0

数字化转型方法论

流程架构梳理 · 业务对象建模 · 数字化转型一张图

一切智能化的底座
解决"系统怎么跑、怎么部署、怎么扩展"的问题。
微服务架构

Spring Cloud Alibaba

Nacos 注册/配置中心、Sentinel 流控熔断、Seata 分布式事务、Gateway 网关

Spring Boot

微服务基础框架,约定优于配置,快速构建生产级应用

RocketMQ / Kafka

异步消息中间件,解耦服务、削峰填谷

容器化与编排

Docker

容器化标准,一次构建,到处运行

Kubernetes (K8s)

容器编排引擎,自动化部署、扩缩容、滚动更新

Helm

K8s 应用包管理,标准化部署模板

DevOps 与持续交付

GitLab

代码管理与 CI/CD 流水线引擎

Jenkins

自动化构建与持续集成引擎

Prometheus

时序监控数据采集与告警

Grafana

可视化监控仪表盘,保障服务可观测性

DevOps 流水线
代码提交
自动构建
自动测试
镜像打包
K8s 部署
监控告警
数据怎么采、怎么存、怎么算、怎么用
从数据源到 BI 看板,构建完整的数据价值链。
数据采集与集成

Flink CDC

实时变更数据捕获,毫秒级感知源端数据变化

DataX

阿里开源离线批量数据同步工具

DolphinScheduler / Airflow

调度引擎,定时编排 ETL 任务

数据存储与计算

Hive

基于 Hadoop 的数据仓库,面向批量 SQL 分析

Spark

大规模分布式计算引擎,T+1 批量分析

Flink

流批一体计算引擎,秒级实时流数据

ClickHouse / Doris / StarRocks

OLAP 分析引擎,高并发多维分析

数据仓库分层架构
ODS
操作数据层
原始数据落地,保持与源系统一致
DWD
明细数据层
清洗、标准化、去重后的明细事实数据
DWS
汇总数据层
按主题域聚合的轻度汇总数据
ADS
应用数据层
面向报表、接口、应用的最终结果
数据中台与治理

数据中台

统一数据资产管理,避免烟囱式重复建设

主数据管理 (MDM)

统一组织、人员、物料等核心数据标准

数据质量管理

完整性、一致性、准确性、及时性四维校验

数据血缘与目录

追踪数据全链路,支撑影响分析

大数据全链路
数据源
ETL 采集
数据仓库
OLAP 引擎
BI 看板
/
数据 API → 智能应用
AI 底层是怎么工作的
理解这些概念,才能做出正确的技术决策。
核心算法架构
算法类型适用场景
CNN卷积神经网络图像识别、缺陷检测、OCR 文字识别
RNN循环神经网络时序数据、语音识别(已逐步被 Transformer 替代)
LSTM长短期记忆网络长序列建模、设备故障预测、工时预测
Transformer自注意力架构当前 AI 核心架构,NLP / 多模态 / 代码生成
BERT双向编码器文本分类、语义理解、命名实体识别
GPT 系列自回归解码器文本生成、对话、代码生成、推理
训练与推理工具链

PyTorch

最主流的深度学习框架,学术界和工业界首选

Ollama

本地化大模型运行,一键部署 Llama / Qwen / DeepSeek

vLLM

高性能推理引擎,PagedAttention 大幅提升吞吐

OpenAI GPT

GPT-4 / GPT-4o 商业大模型,对话推理多模态标杆

Hugging Face

模型仓库与工具链生态,Transformers / PEFT

AI 关键概念速查表
概念一句话解释
Token 化将文本拆分为模型能理解的最小单元(字/词/子词),是所有 NLP 任务的第一步
Embedding将 Token 映射为高维向量,语义相近的词向量距离近
Encoder编码器,将输入压缩为语义表示(理解输入);BERT 是典型 Encoder
Decoder解码器,基于语义表示逐步生成输出;GPT 是典型 Decoder
向量化将非结构化数据转换为数值向量,是检索和相似度计算的基础
张量 Tensor多维数组,深度学习数据流转的基本单位(标量→向量→矩阵→张量)
梯度下降模型训练核心算法——沿"损失最快减小"方向更新参数
损失函数 Loss衡量预测值与真实值差距,训练目标是最小化它
注意力机制让模型"关注"输入中最重要的部分,Transformer 的核心创新
幻觉 Hallucination模型生成看似合理但不存在的信息,LLM 应用中必须解决的问题
连接算法与业务的关键一层
解决"AI 怎么用到企业实际业务中"的问题。
提示词工程 Prompt Engineering

System Prompt

设定 AI 的角色、行为边界和输出格式

Few-shot / Zero-shot

通过给出示例引导模型输出

Chain of Thought

让模型分步思考,提升复杂推理准确率

结构化输出

约束输出 JSON / 表格,便于程序解析

检索增强生成 RAG

RAG

先检索相关知识,再基于检索结果生成回答

向量数据库

Milvus / Chroma / FAISS,语义相似度检索

文档切片

按语义切分长文档,独立向量化

GraphRAG

引入知识图谱,增强实体关系推理

Reranker

对检索结果二次排序,提升上下文质量

上下文工程 Context Engineering

上下文窗口

模型单次能处理的最大 Token 数量

上下文压缩

摘要或筛选,在有限窗口内塞入最有价值的信息

记忆管理

短期记忆 + 长期记忆,让 AI 具备"记住"的能力

动态上下文组装

实时拼装 Prompt + 检索结果 + 历史对话

模型微调 Fine-tuning

全量微调

更新全部参数,效果好但成本高

LoRA / QLoRA

低秩适配,只训练少量参数,大幅降低成本

SFT 监督微调

用"问答对"数据训练模型

RLHF / DPO

基于人类反馈,让输出更符合预期

Agent 智能体编排

Agent

具备感知、推理、行动能力,自主调用工具完成任务

Tool Use

调用外部 API、数据库、代码执行器

Multi-Agent

多个 Agent 协作,各司其职

Workflow 编排

按流程串联 Agent,形成自动化业务流

AI 工程处理链路
用户提问
意图识别
知识检索
上下文组装
模型推理
Agent 调用
结果生成
AI 能力的业务落地
将底层算法、工程能力转化为可感知的业务价值,让每个岗位都能触达智能。
五大核心应用方向

智能问数

自然语言查询结构化数据,用"说人话"的方式获取经营指标与统计报表

知识问答

基于 RAG 的企业知识库问答,覆盖制度、流程、通知等非结构化文档

智能报告

自动生成经营分析报告、人才盘点报告、项目周报等,数据驱动内容生成

辅助决策

基于数据分析与模型预测,为管理者提供招聘预测、离职预警、编制优化等决策建议

数字员工

7×24 小时在线的智能体,自主完成数据录入、流程审批、通知推送等重复性工作

首批标杆场景(点亮工程)

制度问答助手

员工随时查询公司制度、政策解读,RAG + 知识库驱动,秒级响应

通知问答助手

自动解析通知公告,回答"什么时候放假""报销标准是多少"等高频问题

智能问数(HR)

"在岗人数多少""离职率趋势"——自然语言直达数据,无需等报表

自动打标助手

对简历、培训记录、绩效评语等文本自动提取关键标签,辅助人才画像建设

应用落地的三个技术关键
关键问题说明解决方向
私有化数据理解让模型理解公司内部数据、制度和业务术语RAG 检索增强、企业知识库、本体论建模
降低幻觉减少 AI 编造不存在的信息,确保输出可信知识溯源、置信度评估、人工审核闭环
实时数据接入突破预训练的时间限制,让模型了解最新数据实时数据管道、动态知识更新、Tool Use
业务对练机制
AI 输出结果
业务专家评审
标注反馈数据
模型优化迭代
持续循环 ↺
智能应用全链路
业务场景识别
数据准备
知识库构建
AI 能力编排
应用交付
业务对练
持续优化
技术是手段,转型是目的
没有方法论指导,技术再强也容易"建了一堆系统,业务没有变化"。
流程架构梳理
战略目标
价值链分析
一级流程域
二级流程组
三级流程活动
数字化触点
系统功能映射
层级 说明 示例
一级流程域 企业价值链的核心环节 研发、采购、制造、销售、HR、财务
二级流程组 每个环节下的主要流程 HR → 招聘管理、薪酬管理、绩效管理
三级流程活动 具体可执行的操作步骤 招聘管理 → 需求提报 → 简历筛选 → 面试安排
数字化触点 流程中可被系统承载的关键节点 简历筛选 → AI 智能筛选

业务对象建模

  • 业务对象:组织、人员、岗位、物料、订单、设备等核心实体
  • 对象关系:人员→归属→组织,订单→包含→物料
  • 主数据:跨系统共享的核心数据,数据治理第一优先级
  • 数据标准:统一编码规则、字段定义,确保全公司说法一致

数字化转型一张图

  • 战略层:企业战略目标 → 数字化转型愿景
  • 业务层:流程架构梳理 → 业务对象建模 → 场景优先级
  • 数据层:主数据治理 → 数据仓库与中台 → 数据质量
  • 技术层:云原生 → 大数据 → AI 工程
  • 应用层:核心业务系统 → 智能应用 → 数字员工
  • 组织层:数字化人才 → 变革管理 → 持续运营
技术栈全景速查
一目了然,快速定位每个领域的核心技术。
云原生与中间件
Spring Docker K8s Helm Kafka
Spring Cloud Alibaba, Docker, Kubernetes, Helm, Harbor, CI/CD, RocketMQ, Kafka
大数据
Hive Spark Flink
ETL, DolphinScheduler, Hive, Spark, Flink, ClickHouse, 数据中台
AI 工程
OpenAI
Prompt Engineering, RAG, GraphRAG, Context Engineering, Fine-tuning, Agent
算法模型
PyTorch Ollama Python
CNN, RNN, LSTM, Transformer, BERT, GPT, PyTorch, Ollama, vLLM
监控运维
Prometheus Grafana GitLab Jenkins
Prometheus, Grafana, GitLab, Jenkins
智能应用
📊 💬 📝 🧭 🤖
智能问数, 知识问答, 智能报告, 辅助决策, 数字员工, 业务对练

技术沉淀,驱动智能化

六层架构 · 五大智能应用 · 四个标杆场景 · 10 个 AI 关键概念 · 完整方法论

查看咨询服务