Palantir：大模型的骨架

发表于 2026-03-31 分类于笔记

先把话说人话：Palantir 到底是干啥的

把它想成一家卖「运营级数据操作系统」的软件公司，而不是「又一个做大数据或 BI 的」。外行可以把握三条，就够理解后面说的 Harness。

接烂摊子数据：企业里永远是 Oracle 一张表、Kafka 一串日志、Excel 几个部门私有副本、CRM 里又一堆客户号。Palantir 那一套（业内常说 Foundry 偏商用、Gotham 偏防务等场景）干的头一件事，往往是：把这些异构数据接进同一个平台，能跑流水线、有权限、有血缘，而不是只做一个漂亮看板。
对象化，而不是只有 SQL：平台里核心业务常常落成有类型的对象——比如「客户」「授信申请」「服务器」「工单」，对象之间有固定含义的链接（依赖、归属、审批链、父子订单）。这不是可有可无的锦上添花：权限、审计、自动化动作往往挂在对象/链接上，而不是挂在「某张无名宽表」上——这正是 Harness 要挂住的东西。
让人在真实工作流里用：搜索和图探索、告警、预案（Runbook）、回写业务系统——偏运营与决策闭环，不是只给分析师做月报。

财经稿里「大模型是大脑，××是骨架」的接地气版，换成 Harness 说法是：大模型负责听懂人话、凑推理；Palantir 卖的那套平台，负责告诉你「这句人话落在哪个客户、哪笔单、哪条规则上」，谁在什么权限下能触发什么动作，并且留下能过审计的痕迹。下面用一个极小例子把「Harness」落到动作上，而不是停留在概念层。

一个最小例子：银行售后岗问 AI

场景：客户经理对着 Copilot 说——「帮我看看客户王总上个月那笔经营贷，为啥放款变慢了，现在能不能补件？」

没有企业 Harness 的 LLM 只能靠「瞎搜」：RAG 从制度 PDF、邮件、会议纪要里捞出几段像那么回事的文字，模型拼成一段回答。用户看到「可能和资料不齐有关」，但不知道指的是哪次补件、卡在哪个岗位、触发了哪条风控规则——合规一问就傻眼，模型也可能张冠李戴另一家「王总」。
有 Palantir 式 Harness 之后在干什么（逻辑上多三步）：
1. 消歧：系统里「王总」被绑成唯一客户 ID（对象），上月那笔贷款是另一个对象，中间是「申请—审批—放款」链路上的链接。
2. 可追溯：慢在哪个节点，是流程里的哪一步；哪条业务规则被满足，可指向具体规则版本，而不是飘在空中的自然语言。
3. 行动有边界：LLM 可以生成「建议补哪些材料」的草稿，但是否允许一键触发补件、抄送给谁，由 Harness 里配置的动作 + 权限收紧——网友常说的「Agent 胡来」，在这里是第一公民问题，不是事后补丁。

圆桌里金融侧那句大白话仍可沿用：没有这层「平台语义 + 治理」，机器难稳定「识义」；RAG 只给你「片段事实」，给不了这幅业务画面在合规上成不成立。

为啥常拿 Palantir 讲「LLM + 企业 Harness」——不是说只有它能做平台

理性地讲：任何大公司都能做自己的数据平台、对象层、权限与审计（自研、买套件、知识图谱项目都在同一谱系里）。Palantir 被拿来做叙事，通常有三条「可讲故事」的理由：

产品形态就是「对象—关系—动作」一体化：它不是近两年才蹭 Graph RAG；客户买到的是把领域对象和运营动作写进软件的交付，而不只是「买一个图表工具」。话题转到 LLM 时，很自然把「已有平台层」说成 Harness，把「模型推理」说成外挂的推理引擎——叙事连续。
权限、审计、多租户是硬需求：防务、大金融、关键基础设施这类客户，不能只在 demo 里「模型好像懂」；要能做到这次查询触及了哪些敏感对象、谁批的、依据哪条规则。平台层提供 挂权限与审计钩子的把手——这和只做向量库 + prompt 的轻量栈不是同一种痛苦。
AIP 等产品把话说穿：公开材料里把自然语言、自动化与既有的 流水线 / 对象层绑在一起讲——本质是降低 Harness 冷启动与运维成本（例如用模型从文档、代码里抽规则草案），同时用平台约束模型可调用的工具与数据视图。你听到的「大脑 / 骨架 / 记忆」三分法，可视作同一套商业叙事的口语版；本文统一收成 推理模型 + 企业 Harness。

一句话：不是 Palantir 垄断了「平台」；而是它长期卖的东西，刚好和 LLM 落地缺的「语义、治理与可执行边界」卡在同一痛点上，所以文章爱用它当抓手。

大模型 × 企业 Harness：分工表 + 一条「请求怎么走」

角色	干什么	不干什么（理想形态）
大模型	听懂问法、归纳、草稿、多跳推理、把非结构化材料对齐成「像结构化」的提议	不天然保证「指对的实体」、不自带企业级权限与审计
Palantir Harness	实体是谁、关系怎连、规则/流程版本、谁能动什么、数据血缘与流水线	不替你做开放域闲聊或通识百科

一条极简链路（可与上面银行例子对照）：

用户自然语言进场 → 大模型做意图与槽位抽取（要查谁、什么时间范围、要什么动作）。
Harness校验：实体 ID、链接是否允许该角色看见、是否跨法人/跨条线违规。
Graph RAG / 结构化查询：沿关系拉子图，把「和这次问答真正相关的」窄上下文交给模型，而不是整库向量 Top-K。
大模型生成答复与建议步骤；平台/工作流记录：触达对象、引用规则版本、是否进入人工复核。

讨论里提到的 「反射式能力」可理解为：Agent 不是只盯着静态工具清单，而是先看「当前操作对象在平台上允许哪些动作与数据视图」，再决定调用啥——减少越权与乱调接口。

逻辑图示（SVG）

下图浓缩上文的「四步链路」：大模型负责语言与推理；Palantir 企业 Harness负责指对谁、能看什么、能动用哪条规则/哪个动作；子图检索收窄上下文；最后答复 + 审计落回可追责对象与规则版本。

大模型与 Palantir 企业 Harness：请求链路

一句话结论（收束）

大模型是「推理发动机」。Palantir 在长期交付里扮演的角色，是把数据集成、对象化、规则与权限、可审计动作编成一层企业 Harness——让 AI 在复杂系统里有轨可行、有据可查。近年产品与资本市场叙事里常见的 AIP 等，多半也是「降低 Harness 搭建成本 + 用 Harness 约束模型」这一方向上的商业化说法（具体以官方为准）。

背景：为何「殊途同归」

云可观测：数据海量、异构、动态；单靠「收数再推理」接近困难的逆向工程。现象 ≠ 本质，缺口往往在系统建模与统一对象视图而不只是更多数据。
银行风控：监管要求强，AI 必须可解释、可追溯；没有结构化的业务—技术语义，RAG 召回也易造成「看似有事实、却不知场景与因果」的幻觉式决策依据。
共同点：在噪声里缺一张让机器与用户共同认账的运营级世界模型——Harness 要承载的就是这层「可执行、可审计」的语义底座。

没有 Harness 之前：三类「鸿沟」（可观测视角归纳）

数据鸿沟：原始数据碎、噪多；故障时告警分散在指标 / 日志 / 链路等多系统，人工拼剧情、高度依赖专家经验。
模型鸿沟：模型黑箱、幻觉；缺先验结构时易把时间相关误判为因果（如 A、B 同因于底层依赖 C，却判成 A 导致 B）。
工程鸿沟：PB–EB 级采集、清洗、存储、成本与安全。

金融侧补充：没有平台语义层时，机器难以稳定「识义」；RAG 容易停在「片面事实」层面，难以回答「描绘了什么业务场景、是否合规」。

Harness 里「长什么样」（具象化）

图视角：对象是节点、关系是边；不仅是表或原始数据，而是带语义约束的运营图（谁依赖谁、观测挂在哪个实体上等）。故障时可沿边做根因扩散与自动化排查。
业务 vs 技术：业务语义澄清条款与业务含义；技术对接连系统、API、库表。
可拆层次（圆桌里的嘉宾框架，改写成 Harness 语言）
- 实体模型（客户、授信申请等）
- 流程模型（如五级：领域 → 价值链 → 活动 → 任务 → 步骤）
- 行为模型（实体可执行动作）
- 规则模型（从代码 if/else 中抽出可治理规则）
- 数据模型（映射仓库与核心系统接口）
  流程若没在 Harness 里钉死，AI 就容易越界，与金融行业「每一步可审计」冲突。

「血肉」：Graph RAG 与渐进加载

Graph RAG：图关系 + 检索，为模型补语境；与纯向量召回互补。
渐进加载：对象与规则规模大时先暴露「目录」，按需深入，避免一次性灌满上下文。

最大难点往往不是代码，而是「隐性知识」

认知隔阂：专家经验模糊（「一般不会挂，除非数据库…」），要落成可计算、可链路化的模型，需大量沟通与抽象。
隐性依赖：只存在于老员工脑子里的依赖，文档与 CMDB 里都没有。
金融领域案例：资深审批「一眼有问题」，但难以立刻结构化描述症结。
落地策略（归纳）
- 硬：标准 schema / 行业模板、可视化建模（降低冷启动成本）。
- 软：不要一步到位；先核心实体与关系，一个高痛场景 MVP 闭环，用缩短排障/审批时间等可感知收益带动共建。
- 人与激励：业务侧承担大部分梳理工作；Wiki 式荣誉激励；用大模型辅助从制度文档、代码中抽取规则草案以节省专家时间。

给入行者：第一件该做 vs 不该做

不要：一上来「全盘建模」；为平台而平台（RAG 或现有工具已够则勿过度设计）。

要先：选最痛、最高价值场景，建最小可用 Harness（对象 + 权限 + 一条闭环），跑通 MVP；业务深度参与概念对齐，避免技术闭门造车。