AI 聊天应用的 10 条高级需求 - ExperDot
最新动态
GitHub 开源:https://github.com/experdot/pointer
作为大语言模型的深度用户,我发现当前 Web 和桌面端的聊天工具体验不佳。经过长期使用,我总结了 10 个改进需求,希望能清晰表达。
1. 全局检索(Global Search)🔍
上次那个绝妙的点子,现在只记得它很绝妙了 💡
我跟 AI 的对话,其实就是我思考过程的延伸和记录,但现在大部分 Web 端 AI 聊天应用没有检索功能。
我工作中经常遇到这种情况: “几周前问过一个关于正则表达式的技巧,当时 AI 给的例子很好,现在又要用,但想不起来了。” 于是我只能在长长的历史记录列表里凭感觉往下滚,滚几下也找不着,最后大概率还是放弃,只能重新构思问题再问一遍。这属实浪费时间了。
理想中的全局检索:
- 功能强大,而不只是关键词匹配:不仅能搜关键词,最好还能按时间范围筛选,比如“上周的”或“2025 年 5 月”。
- 结果呈现要带上下文:搜索结果不应该只是一个孤零零的对话标题。点开一个结果,应该能直接定位到那条具体的问答,并且能看到它前后的三五轮对话。这样我才能立刻回忆起当时讨论的背景,知道这个答案是不是我想要的。
- 与分类功能联动:如果我实现了下面的“分类”功能,那检索就应该能限定在某个分类或文件夹下进行。比如我只想在“工作”这个分类里找,这样结果能更精确,排除掉其他生活、娱乐的干扰。 简单说,我需要的是个人知识库搜索引擎,而不是一个按时间排序的聊天记录列表。
2. 分类(Categorization)📁
当你置顶了所有对话,也就没有任何对话被置顶 📌
上文有提到,现在几乎所有的 AI 聊天界面,对话历史都像个资讯软件的信息流,对话按时间从新到旧排列,最多有个对话置顶功能。这对于临时用一下的用户还行,但对我这种把 LLM 当生产力工具的人来说,时间一长,这个功能就不够看了。最主要的,我的思考是分主题的,但记录却是线性的,完全对不上。
由用户主导的分类管理系统:
- 自定义文件夹和多层嵌套:我想自己建文件夹,比如“工作”、“学习”、“生活”、“临时想法”。在“工作”下面,我可能还想建“项目 A”、“项目 B”、“周报材料”等子文件夹。这种树状结构符合人脑的整理习惯。
- 自由排序和拖拽:建好文件夹后,我希望可以手动拖拽对话,把它从一个文件夹移动到另一个。文件夹本身,以及文件夹里的对话,我也希望能手动排序,把重要的、常用的放在最上面。
- 高效的批量管理,特别是“清空”:我会有一个叫“临时会话”的文件夹,专门放那些问完就扔的、一次性的问题。现在的产品,要么只能一条一条删,要么就“全部删除”,太极端了。我希望有个“一键清空文件夹”的功能,让我可以直接地把这个“临时”文件夹里的几十条对话一次性删掉,同时保留其他重要文件夹的内容。 有了这套系统,我的聊天历史就能从线性信息流,变成井然有序、可以随时查阅的知识树。
3. 导出图片(Export Image)📸
传统聊天 App:我们什么时候才能学会 Markdown? 😅
AI 生成的内容,尤其是代码块、表格、列表这类用 Markdown 格式化的,直接在 Web 页面上看很不错。但我的需求不止于查看,我还要分享。比如,把一个代码片段分享到技术群,或者把一个 Markdown 表格发给同事。
现在的痛点是:
- 复制文本,格式尽失:直接复制粘贴到微信、钉钉这类平台,Markdown 格式会荡然无存,代码没有高亮,表格乱成一团,可读性全无。
- 系统截图,笨拙低效:用系统自带的截图工具(比如微信截图 Alt+A)是目前的无奈之选。但如果内容很长,需要滚动,那长截图的体验也是很不行。经常截不全、拼接有断层,还把网页上无关的 UI 元素也带了进去。 我的理想方案:
在每一条 AI 的回复旁边,除了“复制”按钮,再加一个“导出为图片”或“复制为图片”的按钮。点击一下,就能生成一张保留了原始格式、代码高亮、样式美观的图片,直接存到剪贴板里,我 Ctrl+V 就能发出去。如果能再高级一点,允许我选择“带/不带我的提问”、“带/不带白色/暗色背景”,那就更完美了。
4. 选择导出(Selective Export)✂️
聊天分享的关键就是分享关键的聊天 🎯
一个完整的对话,往往是一个从模糊到清晰的探索过程,里面有弯路,有废话,也有灵光一闪的精华。有时候我并不想分享整个对话,我只需要其中的“第 2 轮提问”、“第 3 轮回答”和“第 5 轮回答”组合起来,形成一个完整的解决方案。
现在的工具做不到。我只能一段一段地手动复制粘贴,再到一个编辑器里自己整理。
我想要的是一个“勾选模式”:
- 在对话的每一条记录(包括我的提问和 AI 的回答)前面,都有一个复选框。
- 我可以像逛淘宝点选商品一样,自由勾选我想要的任意几条记录。
- 勾选完毕后,旁边出现几个操作按钮:“合并复制为文本”、“合并导出为图片”。这样,我就可以一键生成一个干净、连贯、只包含精华内容的结果,无论是文本还是图片,都能直接拿去用。
5. 编辑聊天(Edit Chat)✏️
这话我没说过! 🙅
AI 的“幻觉”问题,或者说它有时会犯的一些事实性错误,是深度使用中一个巨大的干扰。AI 对自己的话深信不疑。如果它在第二轮对话里搞错了一个关键概念,那接下来无论我怎么直白还是旁敲侧击地提示,它都很可能在这个错误的认知上一路狂奔下去,导致整个对话的后续部分都被污染了。
现在的我,只能选择放弃这个对话,重新开个对话。
我需要的是直接“修正”的能力:
我希望可以直接双击 AI 的某条回复,进入编辑模式,像修改自己的笔记一样,把里面错误的地方删掉或改正。比如,它把一个函数的参数写错了,我直接给它改对。这样,我再继续提问时,AI 就会基于我修正过的、正确的内容来往下聊,保证了对话的质量和连贯性。这才是真正的人机协作,而不是我单方面地迁就机器的错误。
6. 树形聊天与分支书签(Tree Structure & Branch Bookmarks)🌳
聊天树 🌲
一旦有了上面提到的“编辑”功能,一个线性的聊天记录就不够用了。因为我可能想看看“如果当时不纠正它,会聊成什么样”,或者“针对同一个问题,尝试两种不同的追问方式”。这时候,聊天记录自然就应该变成一个树形结构。
大部分 AI 聊天应用这点做得不错,比如 DeepSeek,它就是树形的。但用着用着,新的痛点又来了:
当我从一个节点衍生出三四个分支,其中一个分支的讨论结果我特别满意,简直是灵感迸发。然后我再去探索其他分支,过了一会儿,这个满意的分支就被淹没在众多节点里了,我甚至不记得它是从哪个节点岔出去的。这种感觉让人特别没有安全感,不敢随意探索。
我的需求是在树形结构的基础上,增加“分支书签”功能:
当我聊到一个特别满意的节点时,希望能给这个节点“打个星”、“加个书签”或者“命名该分支”。这样,在侧边栏的树状图里 (树状图似乎也是一个需求),这个节点就会有一个高亮的标记。最好再有一个单独的“书签列表”,能把我所有标星过的节点都收集起来,我一点就能直接跳转过去。这样我就可以毫无顾忌地去探索任何可能性,因为我知道,最好的那条路已经被我标记好了,随时可以回来。
7. 折叠聊天(Collapse Chat)📄
鼠标滚轮使用率首次超越左键 🖱️💨
有时候,为了解决一个问题,我会让 AI 生成一大段代码、一份详细的报告或者一个长长的列表。这个回答本身很有用,但它会占据整整两三屏的屏幕空间。当我需要回头看看上面几轮的对话,或者想看清下面的对话时,这个巨大的内容块就成了视觉障碍,我得不停滚动鼠标,很容易就迷失了上下文。
我需要一个简单的折叠功能:
- 自动折叠:超过一定长度(比如 20 行)的回答,可以默认只显示前几行,后面跟一个“…展开”的按钮。
- 手动折叠:每一条回答旁边都有一个可以手动点击的“折叠/展开”的箭头。我想看就展开,不想看就收起来。最好还有个全部展开、全部收起的快捷按钮。 这样一来,整个对话流的结构就会非常清晰,我可以让视线只聚焦在我关心的那几轮对话上,直接提升来回翻看、梳理思路的效率。
8. 切换模型(Switch Model)🔄
模型如衣服 👔👗
不同的模型有不同的特长。有的模型逻辑推理强,适合分析问题、写代码;有的模型语言风格好,适合润色文案、做创意写作。
现在的流程是,我想换个模型,就得把整个对话的上下文复制一遍,打开一个新平台的网页,粘贴进去,再开始提问。这个过程比较割裂,而且很难保证上下文的完整性。
我希望能在同一个对话里,无缝切换模型:
就在我打字的输入框旁边,或者上方,有一个下拉菜单,里面是我可用的所有模型(哪怕是同一平台的不同模型)。默认是当前模型,但我可以随时为我的下一句提问选择一个不同的模型。
比如,我用模型 A 分析完数据,得到初步结论。然后我直接在下面选择模型 B,对它说:“好了,基于上面的分析,帮我写一篇生动的汇报稿。” 聊天记录里最好能清晰地标出来,哪条回复是哪个模型生成的。这样,我就可以在一个连贯的对话流里,让不同的“专家”协同完成一个复杂的任务。
9. 隐藏反馈功能(Hide Feedback Features)🙈
没有闭环,因为没人点赞 👍❌
每条 AI 回复下面的“点赞 (👍)”和“反对 (👎)”按钮,我想,对大部分用户来说,都是碍眼又多余。
-
完全没用:我来这里是为了解决我的问题,不是来免费为厂商做数据标注的。我几乎从不点,也没有那个心力去点。
-
容易误触:我常用的是旁边的“复制”按钮,好几次都手滑点到了“点赞”。
-
引发安全焦虑:我的很多对话涉及工作机密或个人隐私。一想到我不小心点了个赞,这段对话可能就被标记然后被提交到后台给人工审核,我就感觉很不舒服,非常没有安全感。 我的建议是:
-
在设置里提供一个开关:让我可以永久性地把这两个按钮隐藏掉。
-
至少做成折叠:把它们收到一个“更多”或者“…”的菜单里,我需要反馈的时候自己去点开。这样既保持了界面的清爽,也避免了误触。
-
或者,改变交互:保留“反对”并增加二次确认(比如弹窗问你“哪里不好”),这还有点意义。但“点赞”这种单向的反馈,真的可以弱化甚至拿掉。
10. 导入导出功能(Import/Export Functionality)📤📥
聊天树是一颗居家盆栽 🌼
我在 A 平台上积累了上百个对话,现在 B 平台出了个新模型,或者我安装了个支持本地部署的桌面端 APP,我想把这些对话历史迁移过去,怎么办?没办法。我的这些数据,这些“知识资产”,被锁定在了最初的那个平台上。
我觉得是产品应该具备的功能:
- 提供完整的导出功能:不只是导出成一个光秃秃的.txt 或.md 文件,而是导出成一个结构化的文件,比如 JSON 格式。这个文件里应该包含完整的对话结构,谁说的,什么时间,如果是树形聊天,分支结构也要保留。
- 提供对应的导入功能:我可以拿着这个导出的文件,在任何一个支持这个格式的客户端或平台上,把它原封不动地还原回来。 这就像我们可以用.docx 文件在 Word 和 WPS 之间无缝切换一样。当实现了数据的自由流动,用户才真正拥有自己的数据。
总结
总而言之,我希望产品设计范式能有所转变:从将 LLM 视为一个临时的问答机器人,转变为一个可长期依赖、结构化、可管理、可检索、可移植的个人知识与检索系统,并真正赋予深度用户对其数据和工作流的控制。
AI 锐评 💭
希望产品经理们能看到这份清单 📜,如果看不到 👀❌,我建议你即刻使用 AI 编程工具开始构建应用吧 🚀!
附录
GitHub 开源:https://github.com/experdot/pointer