AI

Agent test

天工智能体测试

Posted by shake on August 1, 2025

天工,在国内的AI圈,算是一个比较神奇的存在,你很少看到他们官方的宣传。但是他们的产品在目前的智能体里,真的能投入使用的。

至少在现在的时代,任何厂商的模型都有自己擅长的,不擅长的。你就用他擅长的部分就可以。

在过去2个月的时间里,对天工,可能真的算是全面测试,让他干各种活,最后选择他擅长的场景来干活。

确实让我认识到:收集材料,总结材料,写文章的事情。Agent比人类更强。

目前manus,minimax,确实是有惊艳的地方,但是使用成本过高。页导致很难用起来。

天工技术上如果有明显短板的话:那么就是无法识别图像,我上传的pdf文件里,包括的图片信息,无法识别,验证过竞争对手,manus,minimax,都是可以做到的。这个其实所有的RAG,都存在的问题。

提示词

对于Agent来说,提示词没有太多的特别,对于写文档,ppt来说。把你要干啥说出来,剩下一个关键就是:目标读者是谁,这个会直接影响文章的内容。

如果目标读者:小白

那么内容就会简单很多,不会太深入。

目标读者:公司高层,领导者。或者那个行业的领导:都会影响到写作的内容。

换位思考

以前在公司写ppt,文档,经常说,这个文档,是给公司高层,这个是给一线看的。其实内容都差不多,都是一个人写出来的。我们很难把角色区分开。

用智能体,其实可以很好的解决这个问题。你把目标读者确认后,智能体就会根据目标用户来准备材料。

关于痛点,一个企业里,不同岗位的痛点是不一样的。但是很多时候,自己都没感觉出来有啥不一样,但是智能体是可以区分的。

你可以让智能体,帮你分析行业,部门的关注的问题,领导的痛点是什么。

天工搜集材料,会海外采集数据。如果你的提示词里的内容,有需要的话。这个也是他质量高的一个原因。

文档

天工的文档功能,非常强。有需求,有想法,就可以去验证。例如让他参考某个厂商的白皮书,给你写一份你自己内容的白皮书,这些都不是问题。

很多问题,你也是可以让天工帮你调研,形成文档。

ppt

天工的PPT,我算是用的最多的。你可以直接输入你的提示词,让他生成ppt。有时候也会发现内容非常惊艳。

还可以根据文档来输出PPT。这样其实可以大幅降低阅读文档的时间。这样ppt的内容,就比较可控。

对于天工来说,如果提供的文档参考,他就不会到外面搜索材料。

默认天工的ppt生成是:20页左右。如果你希望更多页数。加上不限制PPT页数,

最近发现天工的ppt,可以参考模版。我也验证了一下,上传了一个ppt模版,提示词里让他们参考这个模版来完成ppt。

并不是直接套用模版,只是学习模版的特点,应用到ppt上,我专门问智能体,你在ppt里,哪些地方用了模版。

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
在制作PPT的过程中,我们参考了模板的方式如下:

模板风格分析: 我们首先分析了附件PPT模板的设计风格、色彩搭配和排版特点。根据收集的信息,模板的设计原则包括:

简洁与一致性设计
注重高对比度的色彩搭配
规范的字体选择与大小(标题至少30磅,正文24磅,最小不低于20磅)
清晰的排版结构
应用模板元素:

色彩方案:沿用了模板中的主色调和辅助色,保持颜色应用的一致性
字体风格:采用了模板中推荐的易读字体,如Tahoma和Georgia等系统字体
排版布局:遵循模板的页面布局设计,包括标题位置、正文区域划分、页眉页脚样式
图形元素:复用了模板中的图形装饰元素、分隔线、项目符号等设计
专业性优化:

保持了高对比度的文本与背景设计,确保可读性
避免了过度使用动画和装饰性元素
为适合教育工作者的专业观众,我们简化了视觉干扰,突出了内容
内容与风格结合:

在模板的视觉框架基础上,融入了与ChatGPT研究与学习功能相关的专业图表和案例
对数据可视化部分特别注重了清晰性和简洁性,符合教育工作者对专业信息的需求
保持了模板的整体美学风格,同时确保内容的专业性和深度

尝试过参考一本书来做PPT,完全没问题,加上提示词:覆盖所有细节。这样很可能让你的ppt页数,超过100页。

天工可以说是按照ppt页数收费,100页ppt,基本是需要1万积分。

表格

我对着天工给的例子,让他统计全球麦当劳的巨无霸的价格,结果这个任务,无法完成。

采集数据,放到表格来展示。这个是不错的想法。目前还没找到场景来玩。

网页模式

其实我自己已经很久没碰过做网页,没啥感觉。到底做网页来干啥。

1
2
https://kzg28b7x2r.space.minimax.io/。 
Transform it into a homepage suitable for PhD students to showcase academic achievements

用中文是没问题的。当时我是直接复制别的厂商的提示词来验证。生成网页,效果比较惊人。你就只需要更换你的图片,名字就差不多。

现在找工作都那么内卷,简历都搞出花。用这个来做自己的简历。确实是眼前一亮。

验证

同行有很多不同的玩法。这里整理一下。改天验证一下。

撰写一篇约10,000字的Adobe公司小说式传记。在保持事实准确性的同时,不要局限于简单的时间顺序叙述,而要创作一个引人入胜的故事。

请利用公开信息创建一份完整的OpenAI组织结构图,展示当前的层级结构和汇报结构。请包含关键人员(注明近期离职情况),并识别各部门的团队成员。请以HTML格式提交。

为我收集2026年AP化学考试的最佳学习资源。

请校对本文档,查找错误,并使用Word进行排版,使其更加完善。

请撰写一份图文并茂的报告,分析过去十年(2015到2025年)北京中考政策的演变。

Convert this PDF into presentation slides suitable for an academic conference. The presentation should be approximately 15 minutes long and must include all key points.

Create a website for a law firm from Better Call Saul, and you need to search for relevant images for building the website, ensuring they exist