返回博客
2026年7月1日22 min read· WinClaw

有了 Data Infra + Vibe Coding,整个世界将被数据和代码驱动

Data Infra 与 Vibe Coding 合流后,Excel 分析、报告生成和泛数据分析应用可以更快开发、部署和分享。

InfiniSynapseData InfraVibe Coding数据分析

过去我们说“数据驱动”,通常说的是企业内部的 BI、报表、指标体系和 SQL。

过去我们说“代码驱动”,通常说的是工程团队把一个想法写成系统、页面、API 和工作流。

但这两件事正在合流。

当 Data Infra 变成可调用的基础设施,当 vibe coding 让应用外壳可以被快速生成,一个新变化就会出现:很多原本只是一次咨询、一次分析、一次报表、一次 Excel 操作的事情,都可以被迅速封装成一个可发布、可复用、可交付的应用。

这不是一个遥远判断。最近已经连续出现了两个很具体的信号。

第一个信号是,InfiniSynapse 刚推出 Data Infra 能力之后,就有同学很快做出了 InfiniSynapse Assistant

这个项目不是 InfiniSynapse 本体,也不是业务模板。它更像一个给 Codex、Cursor、Claude Code、GitHub Copilot 等 AI 编码助手使用的“规则工作区”:把 InfiniSynapse 的公开文档、API 调用模式、Server API、CLI、Chrome Browser Use、产品开发经验和安全边界沉淀成一套本地上下文。

你把这个仓库链接贴给 Codex、Cursor 或 Claude Code,它就不再只凭训练记忆猜接口,而是能先读规则、读文档、读调用顺序,再开始开发。

这件事很重要。

因为 AI 编码助手一旦要接 InfiniSynapse 这样的 Data Infra,最容易错的不是页面,而是底层链路:API Key 能不能放前端,SSE 要不要先连,任务完成后是不是要去 workspace 读产物,上传、下载、预览、浏览器和数据源接口应该怎么组合。

InfiniSynapse Assistant 的意义,就是把这些容易踩坑的经验,变成 AI 开发时默认会读到的上下文。

第二个信号更直观。

今天有一位同学更进一步:不用任何复杂上下文,只说一句“写一个 Excel 数据分析工具”,就通过 AppSparks 快速生成了一个泛数据分析类应用,并且可以发布出来让大家体验:

一句话生成的 Excel 数据分析工具

下面是生成过程截图。右侧可以看到对话里只给出了一句需求:“写一个 Excel 数据分析工具”;生成过程里已经开始调用 data-analysis 能力,左侧则在生成真实的前端代码。

AppSparks 里一句话生成 Excel 数据分析工具的过程

生成结果也不是一个空壳页面。

它有文件上传区,支持 Excel、CSV、JSON;有分析问题输入框;有“关键趋势、异常点、主要洞察”等默认提示语;有历史记录;也有发布按钮。

一句话生成后的 Excel 数据分析工具预览

这件事乍一看只是一个小工具。

但我觉得,它背后透露的是更大的趋势:Data Infra + Vibe Coding 会把泛数据分析应用的开发门槛打下来。

更关键的是,它不是只生成了第一版页面。

当第一版应用出来以后,你还可以继续补一句需求:要求分析完成后必须生成一份 PDF 文档,然后在应用里展示 PDF。AppSparks 很快就把应用从 v1 更新到 v2。

继续用一句话要求应用生成 PDF 报告

这就是 vibe coding 真正有生产力的地方。

它不是一次性“生成一个玩具页面”,而是可以像和一个产品工程师结对一样继续迭代:第一句做上传和分析,第二句补 PDF,第三句改交互,第四句补历史记录,第五句接分享页。

如果没有后面的 Data Infra,这种快很容易停在 demo。

但有了基座以后,vibe coding 就不只是快,而是又快又稳:应用外壳可以快速长出来,文件解析、数据分析、长任务、模型思考过程、报告产物、打印保存这些重能力由基座承接。

下面这张图更能说明这个差别。用户上传 seattle-weather.xlsx,输入一个非常具体的分析问题:哪些月份或季节降水最多,不同天气类型在不同季节的分布差异,高降水日是否伴随更低温度或更高风速,并要求至少生成 3 个图表和 3-5 条结论。

应用不是只把问题转发给模型聊天,而是进入真实的数据分析流程:读取 Excel、识别 sheet、检查 schema、做数据探索、生成图表和报告。

上传 Excel 后开始执行真实数据分析任务

最后的结果也不是一段散落在聊天气泡里的文字,而是一个可以预览、打印和保存为 PDF 的正式报告。

分析完成后生成可打印和保存的 PDF 报告

这也是 Lovable、AppSparks 这类产品最轻便的地方。

它们的核心价值不是替代所有工程系统,而是把“开发、部署、分享”这条链路压缩到非常短:你描述需求,应用马上生成;你继续补要求,应用马上迭代;你觉得可以体验了,就发布成链接分享给别人。

有了 Data Infra 托底,这种轻便就不只是前端轻便,而是产品闭环轻便。

这不是“又做了一个 Excel 工具”

如果只看表面,这个应用很容易被低估。

Excel 数据分析工具,听起来不稀奇。ChatGPT 可以分析 Excel,Claude 可以读文件,很多 BI 产品也能做图表,Excel 自己还有数据透视表。

但这次真正有意思的地方,不是“AI 能不能分析 Excel”。

真正有意思的是:一个普通需求如何快速变成一个可发布的应用。

过去要做这样一个小工具,至少要拆成几层工作:

  • 前端:上传组件、输入框、按钮、历史记录、结果区;
  • 后端:文件接收、任务创建、状态管理、错误处理;
  • 数据分析:文件解析、字段理解、统计摘要、异常检测、趋势提取;
  • 交付:结果展示、历史恢复、分享或发布;
  • 安全:用户文件隔离、API Key 管理、上传大小限制、权限边界。

每一层单独看都不难,但加在一起就变成了产品工程。

这也是为什么很多 AI demo 第一眼很快,第二周就变慢。页面可以生成,真正难的是让它稳定接入数据、跑任务、交付结果,并且可以给别人用。

Data Infra 解决的是后半段。

Vibe Coding 解决的是前半段。

当这两者结合起来,开发者要做的事情就从“重造一套分析系统”,变成“描述我要什么样的应用外壳,以及它应该调用什么样的数据能力”。

一句话生成 Excel 数据分析工具,就是这个变化的一个缩影。

泛数据分析应用会越来越多

我一直觉得,“数据分析”这个词会被重新定义。

过去的数据分析,更像是企业内部岗位:数据分析师写 SQL,BI 工具出报表,运营和老板看指标。

但今天,越来越多普通场景其实都是数据分析:

  • 高考志愿:分数、位次、院校、专业、招生计划、城市偏好、家庭约束;
  • 购物决策:预算、参数、差评、价格、售后、真实使用场景;
  • 投研报告:财报、公告、新闻、行业周期、估值、风险敞口;
  • 招聘筛选:简历、项目经历、技能证据、岗位画像、薪资区间;
  • 企业运营:客户、线索、转化、渠道、内容、收入、成本和组织动作;
  • Excel 分析:上传一个表,理解字段,发现趋势、异常和洞察。

这些场景不一定长得像传统数据产品。

它们可能只是一个网页、一个小程序、一个 Chrome 插件、一个内部按钮、一个工作台,甚至只是一个临时生成出来的 App。

但它们背后的骨架都差不多:

收集约束 -> 接入数据 -> 分析判断 -> 生成交付物。

这就是我说的“泛数据分析”。

泛数据分析不只是让模型回答问题,而是把一个真实世界里的决策过程产品化。

InfiniSynapse 自己也在做一个这样的实验场。

InfiniSynapse Apps 里,已经可以看到高考报考、报告快写、公司尽调、购物比价,以及“泛数据分析应用实验室”等入口。

其中“泛数据分析应用实验室”更像一个生活决策分析师集合:把薪资、住房、教育、健康、消费、家庭财务、公共议题等高频问题,做成可提交给 InfiniSynapse 分析师的小应用模板。用户看到的是一个个轻量入口,背后仍然是同一套 Data Infra 在处理信息收集、结构化分析和结果交付。

InfiniSynapse 泛数据分析应用实验室总览

比如“薪资谈判分析师”这个模板,就不是单纯问一句“我该不该谈薪”。它把职位、地区、经验、offer、岗位经历、市场薪酬证据和谈判上下文拆成结构化输入,再把薪酬分位、证据表和谈判目标组织成一个可以继续提交给分析师的任务。

薪资谈判分析师模板示例

这类实验室的价值不是一次性证明某个单点应用,而是证明一个更大的方向:当基座足够稳定,应用可以被大量、轻量、快速地试出来。

和 ChatGPT 类产品相比,差异在哪里

ChatGPT 这类通用产品的数据分析能力已经非常强。

它适合个人拿着文件进去问问题:帮我看一下这个 Excel,找出趋势,做个图,解释异常,生成一段分析结论。对于大量个人分析任务,这是非常自然、非常低摩擦的入口。

但如果我们把视角从“我自己分析一次”切到“我要把这种分析能力给很多用户使用”,问题就变了。

这时关键不再只是模型会不会分析,而是:

  • 能不能把上传、问题模板、分析过程和结果展示做成固定产品流程;
  • 能不能让不同用户的文件、任务和历史记录隔离;
  • 能不能把某个行业的方法论固化在界面和任务协议里;
  • 能不能发布一个链接,让别人直接体验;
  • 能不能把结果交付成报告、表格、图表、Word、PDF 或仪表盘;
  • 能不能让 Codex、Cursor、Claude Code 继续基于这个应用迭代。

所以我更愿意把它们看成两种不同形态,而不是简单比较谁替代谁。

形态更擅长什么典型边界
ChatGPT / Claude 等通用助手个人即时分析、自然语言追问、文件理解、一次性洞察分析过程通常停留在聊天工作区里,不天然变成一个可发布的垂直应用
传统 Excel / BI结构化数据处理、报表、指标、企业内部流程对非结构化资料、多步骤 Agent、浏览器、搜索和自然语言工作流支持有限
Lovable / AppSparks + InfiniSynapse 这类组合快速开发、快速部署、快速分享应用外壳,并把数据分析、文件、任务、产物交给 Data Infra第一版应用仍需要真实用户反馈、权限设计、稳定性验证和场景打磨

ChatGPT 类产品像一个强大的个人分析工作台。

Data Infra + Vibe Coding 则更像把这种能力封装成产品的路径。

一个偏“我现在要分析这个文件”。

一个偏“我要让很多人都能用这个分析流程”。

这就是差异。

所以,Lovable、AppSparks 这类工具的核心点不是“它们也能写代码”。

更重要的是,它们把一个应用从想法到页面、从页面到部署、从部署到分享变得非常轻。过去你要开项目、搭框架、写前后端、配部署、发环境;现在只要底座能力足够完整,很多小型垂直应用可以先被快速做出来,让真实用户直接体验,再根据反馈继续迭代。

这会改变应用开发的节奏。

以前是先攒需求,再排期开发,再上线验证。

以后很多场景会变成:先把一个可用版本生成出来,立刻分享给用户,拿到反馈,再用 vibe coding 继续改。

Vibe Coding 最适合加速场景层

Vibe Coding 的价值,不是让每个人都从零造一套完整平台。

真正值得加速的是场景层:

  • 这个应用面向谁;
  • 用户第一步应该输入什么;
  • 哪些文件类型应该支持;
  • 默认分析问题有哪些;
  • 结果应该显示为文字、表格、图表还是报告;
  • 哪些动作需要用户确认;
  • 哪些结论必须有来源、置信度或风险提示;
  • 哪些历史记录需要保存;
  • 最终要不要发布给别人使用。

这些问题很适合由懂业务的人直接和 Codex、Cursor、Claude Code 对话。

懂财务的人可以说:“做一个财报异常分析工具。”

懂运营的人可以说:“做一个渠道转化复盘工具。”

懂招聘的人可以说:“做一个简历批量筛选和面试问题生成工具。”

懂教育的人可以说:“做一个高考志愿冲稳保分析工具。”

懂 Excel 的人可以说:“做一个上传表格后自动找趋势、异常和主要洞察的工具。”

而更底层的部分,应该沉到 Data Infra:

  • 文件上传和解析;
  • 多源数据连接;
  • 数据分析语言和沙箱;
  • RAG 和知识库;
  • 搜索和浏览器;
  • 长任务和进度事件;
  • 工作区产物;
  • PDF、Word、图表和 Office 交付;
  • API Key、安全和权限边界;
  • 任务历史、恢复和下载。

这就是分工。

场景由人和 vibe coding 快速表达。

底座由 Data Infra 稳定承接。

InfiniSynapse Assistant 的价值:让 Code Agent 少猜

在这个变化里,InfiniSynapse Assistant 这样的项目会越来越重要。

因为 Code Agent 很强,但它也容易在不熟悉的新系统里犯错。

没有规则包的时候,它可能会猜 endpoint,猜上传接口,猜 SSE 顺序,甚至把 API Key 写进前端。

有了规则包之后,它可以先读:

  • InfiniSynapse 的官方文档;
  • Server API 调用流程;
  • 数据源、RAG、浏览器、上传下载和任务工作区说明;
  • 高考助手、购物比价、报告快写等产品模式;
  • 安全接入、扫描器、SDK 和回归测试。

这会让 vibe coding 从“凭感觉写代码”,变成“带着基础设施规则写应用”。

一个很小的变化,会带来很大的差别。

因为未来很多应用不是工程师一行行手写出来的,而是由人描述场景,由 Code Agent 生成和修改,由 Data Infra 提供底层能力。

这时,AI 助手读到什么上下文,直接决定了它能不能写出可运行、可维护、可对外发布的产品。

接下来会发生什么

我判断,接下来会出现大量“一句话生成”的泛数据分析应用。

第一批可能都很小:

  • Excel 分析工具;
  • CSV 异常检测工具;
  • 销售线索评分工具;
  • 投研资料摘要工具;
  • 招聘简历筛选工具;
  • 客户访谈归纳工具;
  • 高考志愿分析工具;
  • 运营周报生成工具。

它们可能一开始只是小页面。

但只要底层接的是同一套 Data Infra,它们就有机会继续长大:接更多数据源,加入历史记录,支持多人协作,导出正式报告,连接企业系统,沉淀行业模板,最后变成真正的垂直产品。

这也是为什么我会说:

有了 Data Infra + Vibe Coding,整个世界将被数据和代码驱动。

不是因为所有人都要变成程序员。

而是因为每一个行业里的经验、流程、判断和分析,都可以越来越快地变成一个可运行的软件。

不是因为所有问题都要变成 BI 报表。

而是因为越来越多现实问题都会被重新表达为:收集约束、连接数据、分析判断、交付结果。

过去,软件是工程团队把需求翻译成代码。

现在,懂业务的人可以直接把自己的方法论说给 AI 编码助手,再由 Data Infra 把复杂的分析能力托住。

这会让应用的数量增加很多,也会让应用的形态变得更细、更垂直、更贴近具体场景。

未来的问题可能不再是“AI 能不能分析数据”。

而是:

你的行业里,哪些分析流程应该被做成一个应用?

你的 know how,能不能被 Data Infra + Vibe Coding 变成一个别人点开就能用的产品?

有了 Data Infra + Vibe Coding,整个世界将被数据和代码驱动 | Hailin Zhu