【建议】WPS AI增强跨文档对话功能

  • WPS AI目前可通过三种途径实现跨文档对话:

(一)灵犀工作空间:文件上传,集中对话

灵犀桌面助手提供工作空间机制。用户将多份文档上传至同一工作空间后,可在灵犀的独立对话中引用这些文件进行提问。该方式的优势在于对话上下文独立于具体文档,不会因文档切换而丢失;支持同时引用不同格式的文件(Word、Excel、PDF等);操作流程为上传、提问、获取回答的三步闭环。

其局限性在于:用户需主动将文件上传至工作空间,对于已在WPS中打开并正在编辑的文档而言,这一操作存在冗余;且灵犀的对话界面与文档编辑界面物理分离,用户无法在编辑文档的同时直观地参照被引用文档的内容,分析过程中需要频繁在两个窗口之间切换视线。

(二)灵犀 Claw:本地文件夹,智能读取

灵犀 Claw 采用本地文件夹读取模式,无需手动上传。用户将相关文档存放在同一文件夹下,灵犀 Claw 即可自动识别并读取其中的文件内容,在对话中进行跨文件分析。

该方式简化了文件准备流程,对需要频繁更新的本地文档管理较为便利。但同样存在对话界面与文档编辑界面分离的问题,且依赖文件夹作为组织单元,对于已打开但分布在不同目录下的文档缺乏灵活的引用能力。此外,文件夹的组织方式要求用户在分析前预先整理文件目录结构,对于临时性的多文档分析需求而言,这一前置准备成本较高。

(三)WPS AI 内置对比功能

WPS AI 在特定场景下已具备文档级对比能力:在文档审阅中可识别两份文档间的差异,在表格中可对两个工作表的数据进行对比分析。这些功能在合同版本比对、数据校验等具体场景中提供了有效支持。

然而,上述对比能力限于预设的结构化流程,用户无法自由地用自然语言描述跨文档分析意图,也难以在一次对话中完成涉及三份以上文档的复合分析任务。对比结果通常以固定模板呈现,缺乏基于用户特定分析需求的定制化输出能力。

三种现有方案均在不同维度上解决了多文档处理的部分需求,但均未覆盖一个核心使用场景:用户在WPS中已打开多份文档,希望在当前文档的AI对话中直接引用其他已打开文档的内容,进行灵活的跨文档分析与信息整合。这一场景在日常办公中的出现频率远高于前述三种方案各自覆盖的场景,属于当前产品能力的一个显著缺口。

  • 核心痛点分析

痛点一:已打开文档间缺乏AI对话的互引用能力

目前每个打开的文档对应一个独立的AI对话实例,文档A的AI对话无法访问文档B和文档C的内容。当用户需要在文档A的分析中引用B和C的数据或结论时,必须分别切换到B和C提取信息,再手动转回A进行整合。这一过程增加了操作步骤,且手动传递信息容易导致上下文缺失和格式错乱,降低了多文档分析的效率和准确性。

痛点二:多文档分析中的上下文连续性不足

跨文档分析往往包含多步推理:读取文档A的数据、对比文档B的同期数据、结合文档C的策略描述、综合判断因果关系。这种分析需要连贯的对话上下文来支撑推理链条的完整性。当前每份文档的AI对话相互隔离,用户在不同对话间切换时,前序分析的上下文无法延续,迫使用户以人工方式维护分析思路的连续性,增加了认知负荷。

痛点三:批量同类文档的处理效率偏低

实际工作中存在大量需要对多份结构相似的文档执行相同分析任务的场景:例如财务人员对12个月的月度报表分别检查异常项,销售管理人员从15份区域月报中分别提取关键指标并汇总比较。目前需对每份文档逐一发起AI对话并重复输入相同的问题,操作重复度高,且各文档的分析结果分散在不同的对话记录中,缺乏统一的汇总视图。

痛点四:文档间的逻辑关联未被系统感知

在复杂分析任务中,文档之间通常存在明确的逻辑关系——数据源文档与分析报告文档的引用关系、初稿与修订版的版本关系、同一项目下不同分支文档的归属关系等。当前WPS AI未建立文档间关联的感知机制,所有文档间关系均由用户手动维护,系统无法基于这些关系主动提供辅助,例如自动追踪数据来源、检测版本冲突或提示相关文档。

  • 竞品参考与技术可行性

当前主流AI办公产品已在跨文档处理方面形成可参考的实践路径,其技术方案对WPS AI具有直接的借鉴价值。

Microsoft Copilot 在Microsoft 365生态中通过Graph API实现了对用户OneDrive和SharePoint中多份文档的统一访问。用户可直接向Copilot提出涉及多份文档的综合性分析请求,例如"对比这两份季度报告的营收数据,找出差异最大的业务线"。该方案的核心架构特征是构建了一个统一的文档访问抽象层,使AI能够跨越单文档边界获取经过授权的文档内容,同时通过权限管理机制保障数据安全。

Google Gemini 则基于其大上下文窗口技术(Gemini 1.5 Pro支持100万token级上下文)实现多文档处理。用户在Google Workspace中选中多份文档后,可直接向Gemini发起跨文档提问。该方案无需复杂的文档索引系统,依赖模型本身的大容量上下文能力来承载多文档内容,实现路径相对简洁。

上述两种技术路径分别代表了"系统架构层面解决"和"模型能力层面解决"两种思路,亦可组合使用。对WPS而言,跨文档对话的核心技术问题是建立AI对多份已打开文档内容的可控访问机制,这在工程实现上具备明确的技术路线。考虑到WPS已通过灵犀工作空间和Claw积累了多文档读取与处理的工程经验,上述建议的功能增强在技术基础上是可延续的。

  • 功能建议方案

基于前述痛点与竞品分析,提出以下八项功能建议,按实现复杂度从低到高排列,涵盖交互层、能力层和架构层三个维度。

建议一:AI对话中的"已打开文档"引用入口

在WPS内嵌AI对话界面中增加文档引用功能。用户点击对话输入区旁的引用按钮后,可查看并勾选当前已打开的其他文档,勾选后该文档的内容即纳入当前对话的上下文范围。已引用的文档以标签形式展示在输入框上方,显示文档名称和格式图标,支持随时增删。

该建议的实现复杂度较低,本质是在现有AI对话机制基础上增加一个文档选择器,将多份已打开文档的内容传入同一对话上下文。交互层面建议支持全选当前已打开文档的快捷操作,以及按文档类型筛选的功能。建议在文档标签上以缩略信息标注各文档的大小或页数,帮助用户预估上下文占用情况。

建议二:基于意图识别的文档自动推荐

当用户在AI对话中提出的问题在语义上涉及其他已打开文档的内容时,系统可自动识别该意图,并以非侵入式提示框展示建议引用的文档列表。例如用户输入"对比这两份报告的数据差异",系统识别到"这两份报告"的指代后,推荐对应的已打开文档供用户确认。

若能进一步在本地构建轻量级文档摘要索引(仅存储标题、关键词、数据摘要等元信息,不涉及完整内容缓存),系统可在用户提问时基于语义匹配主动推荐可能相关的已打开文档,降低用户手动选择的操作成本。该索引应提供明确的隐私控制选项,允许用户开启或关闭,以及设置索引的自动更新频率。自动推荐的准确性应接受用户反馈机制的持续优化——用户可对推荐结果标记"相关"或"不相关",系统据此调整后续推荐的匹配策略。

建议三:跨文档结构化对比模式

在常规对话之外,新增"对比模式"作为专门的对话类型。用户选择两份或多份文档进入对比模式后,AI自动执行结构化对比分析,输出包含以下要素的对比报告:差异对照表(逐项展示各文档的对应内容,差异处以标注区分);数据趋势可视化(对数值型内容自动生成折线图或柱状图,直观呈现变化幅度与方向);关键发现摘要(以自然语言归纳最重要的差异点与变化趋势)。

该模式适用于合同版本比对、月度数据环比、方案迭代评审等结构化分析场景。AI可根据文档类型(表格、文本文档、演示文稿)自动选取合适的对比策略,用户亦可手动指定对比维度。建议在对比报告中支持交互式筛选功能,用户可按差异类型、差异程度、涉及章节等维度过滤展示内容,避免信息过载。

建议四:文档工作区机制

引入"工作区"(Workspace)作为文档的逻辑组织单元。用户可将逻辑上相关的多份文档归入同一工作区,工作区内的文档自动共享AI对话上下文。

工作区机制的预期特性包括:用户在工作区内的任意文档中发起AI对话时,AI可自由引用该工作区内的所有文档内容;工作区支持持久化保存,文档关闭后再次打开时关联关系自动恢复;支持跨格式的文档组合(Word、Excel、PPT、PDF不限);支持工作区的命名、编辑和删除管理;支持将当前已打开的所有文档一键归入新工作区,降低创建成本。

该建议的实现需要一定的架构投入,但在用户体验层面能够显著降低跨文档分析的操作成本——用户只需一次归组操作,后续所有跨文档引用均可自动生效。建议在产品初期以用户手动创建工作区为主,后续可探索基于文档内容相似度和访问模式的智能工作区推荐。

建议五:对话上下文管理器

当引用文档数量增加、内容体量增大时,上下文窗口的容量管理成为一个实际需求。建议提供可视化的上下文管理界面,展示以下信息:当前对话已加载的各文档及其内容摘要;各文档占用的上下文容量(以token数或比例进度条呈现);已用容量与可用容量的实时对比。

用户可在管理器中调整各文档的引用范围,例如对一份大型PDF仅引用特定章节而非全文,以优化上下文空间的利用效率。该管理器应支持文档引用优先级的设定,当总容量接近上限时,系统按优先级自动降级低优先级文档的引用精度(如从全文引用切换为摘要引用),并向用户发出提示。此外,建议支持将当前对话的文档引用配置保存为模板,供后续类似分析场景直接复用。

建议六:批量问答模式

针对需要对多份同类文档执行相同分析任务的使用场景,建议增加批量问答能力。用户选中多份文档后输入统一的提问指令,系统自动对各文档逐一执行分析,最终将结果汇总为结构化表格输出,每行对应一份文档的分析结果。

预期交互流程:用户通过文件标签栏多选文档或在文件列表中多选,触发"AI批量提问"入口;输入分析问题后系统逐个处理并实时展示进度;完成后以表格形式呈现全部结果,支持一键导出至新的Excel工作簿。建议在批量问答结果中增加异常项高亮功能,系统自动标注各文档分析结果中的异常值或偏离项,帮助用户快速定位需要关注的内容。该功能在财务审计、销售报表汇总、法务合同审查等需要批量处理同类文档的业务场景中具有明确的效率提升价值。

建议七:文档关系图谱

在产品中长期规划中,建议构建文档关系图谱功能。系统自动分析已打开文档之间的内容关联,包括但不限于:数据引用关系(文档A的数据源自文档B);版本迭代关系(文档C是文档A的修订版);主题相关性(文档D与文档E涉及同一业务主题)。分析结果以可视化图谱呈现,节点代表文档,边代表关联关系及关联类型。

图谱的交互能力建议包括:点击节点跳转至对应文档;悬停节点查看关联摘要;按关联类型筛选展示。此外,建议支持用户手动编辑图谱中的关联关系——补充系统未识别到的关联,或修正误判的关联,使图谱的准确度随使用逐步提升。该功能的核心价值在于将文档间的隐性关联转化为显性、可操作的可视化信息,对知识密集型业务场景(行业研究、尽职调查、合规审查等)具有辅助价值。

建议八:多窗口协同的快捷交互

在WPS现有的多窗口和多标签页机制基础上,为跨文档AI交互设计低操作成本的快捷手势,包括:拖拽文档标签至AI对话区域以将其加入当前对话上下文;按住Ctrl键多选文档标签后唤出AI对话,自动进入多文档引用模式;在分屏视图(两份文档左右并排)中,AI自动感知两侧文档并进入双文档对比模式。

快捷交互的设计目标是将跨文档AI引用的操作步骤压缩至一到两步以内。操作门槛的降低直接影响功能的实际使用率和用户感知,是从"功能可用"到"体验流畅"的关键环节。建议在产品上线后通过用户行为数据分析,识别高频操作路径并进一步优化快捷手势的设计。

北京
浏览 64
收藏
3
分享
3 +1
+1
全部评论