v3.943.5286.767046 安卓免費版
v1.64.2958.295438 IOS版
v1.692.395.620718 PC版
v2.8.850.113394 安卓免費版
v4.160.4516.194068 IOS版
v1.225 安卓版
v3.204.5087.182530 安卓最新版
v4.139.4575 PC版
v6.263.5698 PC版
v9.696.1088 安卓最新版
v5.186.8343 IOS版
v9.672.2145 安卓版
v8.947.2491 最新版
v3.549 最新版
v4.832.5836.914600 安卓漢化版
v7.917.7272.154712 安卓免費版
v2.955.9608 安卓最新版
v4.494.5409.609507 安卓版
v4.159.2018.177272 安卓版
v8.376 IOS版
v7.43.6111.112477 PC版
v4.888 安卓免費版
v7.924.8222.382517 最新版
v2.57.3545.227477 PC版
v2.633.3746.402391 最新版
v5.222.1020.432127 最新版
v6.799.2736.549554 最新版
v9.963.2014.692706 安卓漢化版
v7.892.3800.880243 安卓版
v4.849 安卓最新版
v3.480.5459 PC版
v7.471.1400.261398 安卓最新版
v7.484.3072 安卓漢化版
v5.257 安卓漢化版
v2.450 安卓最新版
v5.390 安卓版
v1.151.197 安卓免費版
v1.310.8115.786695 IOS版
v3.722.805.938383 PC版
v3.491.347.732114 安卓漢化版
v1.203 最新版
v9.700.2453.715904 安卓版
v7.191.3946.255423 安卓免費版
v4.66.3949 PC版
v2.242.230.178734 安卓最新版
v1.225.9492.578716 IOS版
v5.391.5294.811647 安卓版
v5.814.5735.620629 PC版
v9.494.5402.126732 最新版
v2.151 安卓漢化版
v3.318.535.860995 安卓漢化版
v6.488.5836 PC版
v6.821.1566 安卓漢化版
v9.431.2301.952910 安卓漢化版
v3.730 安卓免費版
v6.743.8896.827240 安卓最新版
v3.215.4482.762488 安卓漢化版
v1.756.4300.180221 安卓漢化版
v5.626.6762 安卓最新版
v3.653 PC版
v8.489 IOS版
v4.214.7713.713929 最新版
v3.629.5814 IOS版
v3.838.7723.96386 安卓免費版
v4.322.166 最新版
v5.187.6403.534817 最新版
v7.114.8977.716942 PC版
v4.394 PC版
v3.560.7224 安卓最新版
v2.701.1206.416976 安卓版
v8.563 IOS版
v6.543 安卓版
v6.453.4254 安卓漢化版
v8.97.3418.661120 安卓漢化版
v5.894.7387.933759 PC版
v2.433 安卓免費版
v8.724.4505.152610 安卓免費版
v1.111 IOS版
v1.799 安卓版
v9.982.8335 IOS版
bet365官网哪个真的
智东西作者 陈骏达编辑 云鹏
智东西9月27日报道,近日,月之暗面正在小规模灰度测试Kimi的Agent模式“OK Computer”。OK Computer的目标是通过新万博体育:轮次推理、新万博体育:工具调用、新万博体育:token消耗,带来新万博体育:智能,月之暗面将其定义为一款“全栈助理”。
在OK Computer模式下,Kimi将拥有自己的虚拟电脑,可以连续工作几十分钟,一步一步自主完成需求调研、规划、分析、设计、开发等环节。
▲OK Computer工作界面,左侧为聊天框,右侧为虚拟电脑(图源:智东西)
与传统依赖人工预设工作流的方式不同,OK Computer背后是月之暗面的原生Agent模型Kimi K2,能应对新万博体育:任务场景和突发情况。
借助端到端强化学习技术,Kimi K2掌握了文件系统、浏览器、终端、代码、图片生成、音频生成等20多种工具的使用方式,拥有完成复杂任务所需的内在知识。
官方Demo中,OK Computer能够直接交付功能模块丰富的多页面网站、移动端友好的Web应用以及可编辑的高品质演示文稿等产出物,也能够把几十万行的Excel 数据进行可视化、交互式呈现。
目前,过去两年曾经给予Kimi打赏鼓励的用户,将优先获得OK Computer的体验席位,这部分用户打开网页版Kimi即可收到邀请。
月之暗面称,Agent模式下单个任务的token消耗量可达常规对话模式的几十倍,OK Computer会根据服务器负载情况逐步扩大灰度测试范围。智东西也对OK Computer的表现进行了体验。
一、一手体验海量数据分析能力,把英伟达投资策略捋清了
获得OK Computer模式体验机会的用户,在Kimi首页输入框的左下角能找到OK Computer模式的切换按钮,点击后即可使用。
官方提供了OK Computer模式下的一些模板提示词,如果想体验其能力,又不愿意撰写复杂提示词,可以直接选用这些模板。
智东西从中选择了一项数据可视化任务,要求Kimi从雅虎财经获取英伟达过去两年的股价和财报数据,并分析股价的暴涨是否主要发生在财报发布前后、比较估值(市盈率P/E)与标普500科技板块的平均值。
此外,Kimi还需模拟在每次财报发布前一周买入,发布后一周卖出的交易策略,长期来看是否盈利。
设计风格方面,提示词要求Kimi采用低饱和度的英伟达品牌色,保持布局简洁和谐,仅使用纯色(无渐变),并通过优雅图标提升清晰度。
收到任务后,Kimi会在右侧呈现它在虚拟电脑中进行的各类操作。在开始任务之前,它一般会撰写待办事项,对任务流程进行全面规划,然后再正式执行。
开启OK Computer模式后,Kimi会列出其进行的每一步操作,包括使用数据源、使用文件、使用iPython、使用部署工具等等。分析完成后,它还用简洁的语言给出了关键发现,并将分析图表和结论做成了一个完整的网站,耗时5分钟左右。
生成结果:
https://www.kimi.com/share/19988a15-7962-8c6a-8000-0000857b187e
可以看到,Kimi给出的网页完成度较高,数据可视化清晰,跳转逻辑正确,还提供了JSON格式的分析数据。
智东西核验了页面中部分关键数据的正确性,如英伟达市值、股价等等。在我们的抽查范围内,数据基本无误,不过英伟达的市盈率与雅虎财经上显示的数据有出入。
这一任务考察的能力类型众多,OK Computer模式下的Kimi需要从指定来源抓取正确数据和对应时间,理解提示词中谈到的各种金融术语,还需要利用Python进行数据分析,并将结果按照风格要求可视化。如果是人工完成,可能需要耗费数小时。
我们将官方提示词中的企业从英伟达改为AMD,切换了比较的基准,Kimi同样能给出类似质量的分析结果,这在某种程度上也印证了其能力不是完全靠“背题”实现的。
生成结果:
https://www.kimi.com/share/19988bb0-9b82-864d-8000-0000e74d03a4
不过,OK Computer并不是市面上唯一一款具备类似能力的Agent,我们也将这一任务交给了Manus。
可以看到,Manus的执行风格更偏向直接上手做,收到任务后直接就开始查询财经数据的API了。Manus最终交付了一份MarkDown文档,以及四张数据图表。
Manus的报告内容更为宏观,在具体数据的呈现上比OK Computer更少,报告长度也更短,任务耗时比OK Computer长。数据可视化方面,其图表的美观程度和OK Computer相比还有一定差距。
二、擅长PPT、多功能网站开发,多位网友给出好评
月之暗面介绍,OK Computer已掌握的工具集包括列待办事项、写Python代码、操作终端、浏览网页、文字搜索、图片搜索、图片生成、音频生成、接入专业财经数据源、网站部署等。
在该公司的内部测试中,OK Computer目前擅长的任务类型,包括多功能网站原型开发、海量数据分析与可视化、高品质演示PPT制作等。
x平台上的一名科技博主分享,他用OK Computer打造了一个功能完备的星座网站。这个网站可以帮助用户了解每个星座的特征,还可以比较两个星座之间是否匹配。其设计风格也与网站的主题较为匹配。
▲OK Computer生成的星座网站(图源:Gadgetify)
还有网友分享,自己用OK Computer打造了一个文档比较网站,可以看到这一网站设计简洁美观,这位网友反馈完成率还不错。
官方Demo中,借助OK Computer,Kimi还打造了一份对电影《2001太空漫游》视觉元素的深度解析PPT,要求仅使用电影原图与影视和学术深度解析文章。
Kimi会先设定计划,搜索电影原图素材和关键场景的图片,搜索电影深度解释和学术研究资料,经过深度研究和素材资料收集,然后才开始按照视觉规范制作PPT。
最终,Kimi可以交付一份演示文稿,既可以在线分享,也可以下载到本地。
结语:从问答机器到全栈开发,大模型竞逐Agent能力
月之暗面称,未来他们会为OK Computer模式带来更丰富的工具选项和自定义工具能力,也支持连接新万博体育:外部应用,让Kimi可以完成新万博体育:类型的任务。
这也顺应了行业内的一大趋势:通用大模型正从知识问答阶段、生产力工具阶段迈向通用Agent阶段。未来,谁能率先在工具生态整合、长时任务执行、可靠性和合规性上建立优势,谁就可能在新一轮竞争中占据先机。
相关版本
多平台下载
查看所有0条评论>网友评论