Kimi第一次有自己的电脑了,分析师、工程师样样精通,一手实测来了!
智东西作者 陈骏达编辑 云鹏
智东西9月27日报道,近日,月之暗面正在小规模灰度测试Kimi的Agent模式“OK Computer”。OK Computer的目标是通过新万博体育:轮次推理、新万博体育:工具调用、新万博体育:token消耗,带来新万博体育:智能,月之暗面将其定义为一款“全栈助理”。
在OK Computer模式下,Kimi将拥有自己的虚拟电脑,可以连续工作几十分钟,一步一步自主完成需求调研、规划、分析、设计、开发等环节。
▲OK Computer工作界面,左侧为聊天框,右侧为虚拟电脑(图源:智东西)
与传统依赖人工预设工作流的方式不同,OK Computer背后是月之暗面的原生Agent模型Kimi K2,能应对新万博体育:任务场景和突发情况。
借助端到端强化学习技术,Kimi K2掌握了文件系统、浏览器、终端、代码、图片生成、音频生成等20多种工具的使用方式,拥有完成复杂任务所需的内在知识。
官方Demo中,OK Computer能够直接交付功能模块丰富的多页面网站、移动端友好的Web应用以及可编辑的高品质演示文稿等产出物,也能够把几十万行的Excel 数据进行可视化、交互式呈现。
目前,过去两年曾经给予Kimi打赏鼓励的用户,将优先获得OK Computer的体验席位,这部分用户打开网页版Kimi即可收到邀请。
月之暗面称,Agent模式下单个任务的token消耗量可达常规对话模式的几十倍,OK Computer会根据服务器负载情况逐步扩大灰度测试范围。智东西也对OK Computer的表现进行了体验。
一、一手体验海量数据分析能力,把英伟达投资策略捋清了
获得OK Computer模式体验机会的用户,在Kimi首页输入框的左下角能找到OK Computer模式的切换按钮,点击后即可使用。
官方提供了OK Computer模式下的一些模板提示词,如果想体验其能力,又不愿意撰写复杂提示词,可以直接选用这些模板。
智东西从中选择了一项数据可视化任务,要求Kimi从雅虎财经获取英伟达过去两年的股价和财报数据,并分析股价的暴涨是否主要发生在财报发布前后、比较估值(市盈率P/E)与标普500科技板块的平均值。
此外,Kimi还需模拟在每次财报发布前一周买入,发布后一周卖出的交易策略,长期来看是否盈利。
设计风格方面,提示词要求Kimi采用低饱和度的英伟达品牌色,保持布局简洁和谐,仅使用纯色(无渐变),并通过优雅图标提升清晰度。
收到任务后,Kimi会在右侧呈现它在虚拟电脑中进行的各类操作。在开始任务之前,它一般会撰写待办事项,对任务流程进行全面规划,然后再正式执行。
开启OK Computer模式后,Kimi会列出其进行的每一步操作,包括使用数据源、使用文件、使用iPython、使用部署工具等等。分析完成后,它还用简洁的语言给出了关键发现,并将分析图表和结论做成了一个完整的网站,耗时5分钟左右。
生成结果:
https://www.kimi.com/share/19988a15-7962-8c6a-8000-0000857b187e
可以看到,Kimi给出的网页完成度较高,数据可视化清晰,跳转逻辑正确,还提供了JSON格式的分析数据。
智东西核验了页面中部分关键数据的正确性,如英伟达市值、股价等等。在我们的抽查范围内,数据基本无误,不过英伟达的市盈率与雅虎财经上显示的数据有出入。
这一任务考察的能力类型众多,OK Computer模式下的Kimi需要从指定来源抓取正确数据和对应时间,理解提示词中谈到的各种金融术语,还需要利用Python进行数据分析,并将结果按照风格要求可视化。如果是人工完成,可能需要耗费数小时。
我们将官方提示词中的企业从英伟达改为AMD,切换了比较的基准,Kimi同样能给出类似质量的分析结果,这在某种程度上也印证了其能力不是完全靠“背题”实现的。
生成结果:
https://www.kimi.com/share/19988bb0-9b82-864d-8000-0000e74d03a4
不过,OK Computer并不是市面上唯一一款具备类似能力的Agent,我们也将这一任务交给了Manus。
可以看到,Manus的执行风格更偏向直接上手做,收到任务后直接就开始查询财经数据的API了。Manus最终交付了一份MarkDown文档,以及四张数据图表。
Manus的报告内容更为宏观,在具体数据的呈现上比OK Computer更少,报告长度也更短,任务耗时比OK Computer长。数据可视化方面,其图表的美观程度和OK Computer相比还有一定差距。
二、擅长PPT、多功能网站开发,多位网友给出好评
月之暗面介绍,OK Computer已掌握的工具集包括列待办事项、写Python代码、操作终端、浏览网页、文字搜索、图片搜索、图片生成、音频生成、接入专业财经数据源、网站部署等。
在该公司的内部测试中,OK Computer目前擅长的任务类型,包括多功能网站原型开发、海量数据分析与可视化、高品质演示PPT制作等。
x平台上的一名科技博主分享,他用OK Computer打造了一个功能完备的星座网站。这个网站可以帮助用户了解每个星座的特征,还可以比较两个星座之间是否匹配。其设计风格也与网站的主题较为匹配。
▲OK Computer生成的星座网站(图源:Gadgetify)
还有网友分享,自己用OK Computer打造了一个文档比较网站,可以看到这一网站设计简洁美观,这位网友反馈完成率还不错。
官方Demo中,借助OK Computer,Kimi还打造了一份对电影《2001太空漫游》视觉元素的深度解析PPT,要求仅使用电影原图与影视和学术深度解析文章。
Kimi会先设定计划,搜索电影原图素材和关键场景的图片,搜索电影深度解释和学术研究资料,经过深度研究和素材资料收集,然后才开始按照视觉规范制作PPT。
最终,Kimi可以交付一份演示文稿,既可以在线分享,也可以下载到本地。
结语:从问答机器到全栈开发,大模型竞逐Agent能力
月之暗面称,未来他们会为OK Computer模式带来更丰富的工具选项和自定义工具能力,也支持连接新万博体育:外部应用,让Kimi可以完成新万博体育:类型的任务。
这也顺应了行业内的一大趋势:通用大模型正从知识问答阶段、生产力工具阶段迈向通用Agent阶段。未来,谁能率先在工具生态整合、长时任务执行、可靠性和合规性上建立优势,谁就可能在新一轮竞争中占据先机。
现在还有哪个德州app可以玩
九州体育赌场网站
尊龙官网手机版
沙巴比分网
爱博体育平台
188体育上盘滚球
网上电子赌博
M6官网登录
威尼斯人菠菜
88网页游戏
十大真钱平台
云顶娱乐更新
188bet足球
PG电子游戏官网
德扑圈长期盈利模式
曾道人攻略(最老版)
澳门捕鱼彩金最多
365bet体育首页游戏平台
AG在线游戏娱乐平台
bbin快速登陆
AG真人官网
必赢可靠吗
赛酷体育官网版
pk10盛兴开奖直播
大发体育平台首页
华体会用不了
澳博体育APP
雷竞技raybet下载官网
kok在哪注册
王者体育在线下载
真钱网赌推荐
亚博电竞
大发登录注册平台网址
银河游戏娱乐登录
时时博娱乐城
bbv体育官网登录
ag真人app平台
论坛
足球比分大赢家
永利体育全站APP
登录百老汇
b体育到现在多少年了?
贝博在线登陆
188体育app
AOA官方
果博平台首页
金沙在哪开户
AG真人平台网站
天博综合app官网登录
传奇电玩24小时捕鱼
威尼斯人登陆手机网页版
鸭脖平台怎么样
正规网上购彩票平台
最新捕鱼机
必胜app
永利注册网
欧洲杯2019赛程直播
爱博手机版登陆
Od体育官网登入
欧博体育APP
九球规则
澳门新匍京怎么下载
贝投体育app
永利博在线
ob体育官网入口
雷速体育下载中国
云顶娱乐网页登录入口
葡萄牙最大的赌场
188bet怎么开户
澳门永利电子登录
韦德网址
百家乐投注登录
千亿国际游戏登录平台
澳博官网注册
新莆京网站
365bet官网注
体育平台提款被黑
云顶娱乐网页
曾道人吉数赌经B加大版
天博官网网页版登录
b体育登录
网友评论 查看所有评论>>