关闭广告

测Manus 1.5:丝滑,超预期,Manus独特上下文工程的一次关键展示

硅星人1117人阅读


作者 | 周一笑
邮箱 | zhouyixiao@pingwest.com

过去半年多保持低调的Manus,进行了一次值得关注的更新,Manus直接从1.0版本跨越到1.5,中间没有经历小版本发布,团队似乎在憋一个大招。

事实是Manus团队花了7个月时间专注于架构级改进,最终交出了Manus1.5,根据官方数据任务完成速度提升近4倍,从平均15分钟缩短到不到4分钟;任务质量提升15%,用户满意度提高 6% 。

根据官方的介绍,Manus1.5版本最大的亮点在于全栈Web应用开发能力。现在你可以通过对话来构建和部署生产级Web应用,包括后端服务器、数据库、用户认证系统、自定义域名、内置分析,甚至版本控制,所有这些都不需要离开Manus平台。此外,新增的协作功能和 Library 资料库,让团队可以在同一空间共享会话、版本和资产。

作为一个曾经测试过多款AI Coding工具的用户,我对“AI 生成网站”这类功能早已不陌生。当我看到据传是有人用Gemini 3.0复刻macOS的演示后,我决定用Manus 1.5来试试,看它能做到什么程度?

1

实测:一句话,十分钟,复刻MacOS


更新后的Manus1.5可以切换1.5和1.5 Lite,免费用户只能使用Lite。我们选择Manus 1.5来进行测试。

输入Prompt:帮我做一个网页版的复古 Mac OS 桌面。 1、外观风格:要像经典的 Mac OS 9 系统,有标志性的顶部菜单栏和可以拖动的窗口。 2、内置软件:桌面需要包含三个基本软件:一个可以打字的“记事本”,一个能用 AI 画画的“AI 画家”,以及一个“计算器”功能。 3、账户系统:这个网站必须有账户系统。

开始测试,可以看到Manus的界面没什么变化,左边是对话框,右边可以看Manus操作云电脑的过程、预览代码和项目。


输入指令之后,Manus没有问我更多问题,它的第一步是初始化全栈Web项目,搭建后端、数据库和账户系统。像一个专业工程师那样,先打好地基再盖房子。


接着Manus开始设计系统架构和技术方案,并且创建了一个DESING文件。从技术栈、数据库表,到UI细节,甚至可能的技术挑战都提前想好并给出了解决方案。



然后就是开发过程,有点像进入了心流状态的程序员,开始了没有中断的开发,它会自己安装依赖包、重启服务、修正代码中的类型错误。

大概10分钟后,它交作业了!


从视觉上看,Manus确实抓住了一些精髓。标志性的青色桌面背景、顶部的菜单栏、以及三个小巧的应用图标,都颇有几分经典Mac OS 9的神韵。同时好像也抓住了一些Windows复古界面的味道。


不过,看起来不错是一回事,真正能用又是另一回事。我们来试试三个内置的应用:记事本、AI画家和计算器

在测试过程中,我发现这个os像真正的桌面系统,是支持多窗口的,并且各个应用的窗口都可以流畅的点选、拖动和关闭,毫无“网页感”。


最基础的记事本开始,我测试了新建文档,编辑内容,保存这些基本功能都没有问题。


然后是计算器,只有基础的加减乘除,且只能顺序计算,经过测试没有问题。


最后是难度最高的,加入了AI功能的“AI画家”应用,我们来画一只猫咪坐在月亮上。


完全超出预期的真能生图,输入的Prompt中我把“一只”打成了“一直”,不过不影响生成效果,it just work!


注意这里我是没给Manus提供api的,应该是就像Manus在design.md文件里写的,调用了Manus Built-in Image Generation API。只是不知道消耗的token算谁的,扣积分吗?

生成的图片长这样:



关闭后重新打开应用,生成的记录能够正常保存。


接下来测试一下账户系统。默认是登陆状态,我们点击右上角的登出,就进入到了登陆界面。


点击登陆,可以看到它是具备账号系统的,powered by Manus。这个系统应该是直接使用了Manus内置的系统,功能非常完善。


测试一下是否可以用其他账号登陆。我们用一个新的邮箱注册,邮箱顺利收到了验证码,并且成功注册登陆。


登录后,看到的是一个全新的桌面。我在里面进行了几次操作,然后登出,再用第一个账号登录回来,之前的所有历史记录都保存了,两个账户的数据是隔离开的。

应用测试和功能测试都通过了验收,下一步可以选择发布这个网页版的复古版的Mac OS,也可以继续对项目进行修改,Manus还提供了一些推荐追问。这里我们选择发布。


Manus为这个项目生成了一个网页链接,有兴趣的同学可以点击体验:https://retromacos-cnt7elud.Manus.space

1

开始接近“靠谱”的Agent

这次Manus1.5的发布中,官方宣传的一个点是“无限上下文”,这里的无限不是物理上的无限token窗口,而是指通过可逆压缩、结构化摘要、依赖文件系统的快速卸载与检索以及分层动作空间等多种策略,使得Agent能够长期运行,有效管理超长的任务。

在 LangChain 与 Manus 团队的深度访谈中,团队解释了他们的“上下文工程”策略,通过可逆的“压缩”(剥离可重构信息,只保留路径)和不可逆的“摘要”(用结构化模式提取关键信息),再配合上下文卸载到文件系统,让 Agent 可以长期运行而不会因为上下文过长导致“上下文腐败”。这也解释了为什么我这次测试的 macOS 复刻能够流畅完成几十个步骤。


Manus创始人肖弘提到,他们选择的是先构建强大的通用内核,让各种场景自然涌现的路径,“Manus 首先是一个 Agent architecture,然后才是一个产品”。对于一家创业公司来说,不做基础模型,而是把精力放在工程、架构和产品打磨上,做出顶尖的 Web 开发能力,这本身就证明了在 AI 时代,创业公司依然可以通过工程创新找到位置。

最后,坦白说,现阶段的大多数“一句话生成”类 AI Agent产品,对大部分用户来说更多还是做玩具、做Demo的阶段。至少从这次体验来看,Manus 1.5 算是把“玩具”这件事做的更进一步了,整一句Prompt,产出的完成度让人惊艳。当然它也不完美,比如一直被吐槽的积分消耗快这些槽点都存在,以及我们这次没有加入更复杂的测试。但关键在于方向,如果 AI Agent 能从偶尔能用进化到基本靠谱,那距离它真正改变我们的工作方式就不远了。


点个爱心,再走 吧

版权与免责声明:本文内容转载自其他媒体,目的在于传递更多信息,不代表本网观点或立场,不承担此类作品侵权行为的自己责任及连带责任。
猜你喜欢
精彩推荐

看了那么多流行色,还是这个色最适合夏天

LinkFashion 浏览 14658

付豪:其实我们比球迷更想赢球,但球队实力与过去不可同日而语

懂球帝 浏览 303

又一拟上市企业惊现体外资金池,贝特电子IPO失败之谜再追踪!

叩叩财讯 浏览 862

实探封关后的海南三亚:消费者无法全岛"零关税"购物

第一财经资讯 浏览 1053

乌克兰一地遭俄军无人机密集袭击 基辅实施紧急停电

每日经济新闻 浏览 117

陈晓新剧黯然收官!口碑崩塌评论区沦陷?

萌神木木 浏览 513

对标丰田4Runner 本田新款Passport最新消息曝光

乐选爱车 浏览 1237

沉默的荣耀大结局前瞻,最惨角色出炉,果然不幸的人各有各的不幸

娱乐圈笔娱君 浏览 1167

宁德时代:钠新乘用车动力电池正在与客户推进开发、落地中

IT之家 浏览 964

陈道明说的没错,不拍戏就消失的欧豪,已经走上了另外一条道路

豆哥记录 浏览 200

2025款奔驰GLB 220典藏版上市 售价34.99万

车质网 浏览 683

月薪涨150被骂抠门?宁德时代宣布涨薪,回应来了;小米汽车将开放「现车选购」,预计年底前可提;字节联手中兴打造首款豆包助手手机

雷峰网 浏览 588

一年暴赚233%的新“公募一哥”,新基才刚刚回本

深蓝财经 浏览 101

全租房里,一场韩国楼市的海啸

蓝鲸财经 浏览 13801

偷鸡不成蚀把米!白百何疑开撕王传君,自己却先被骂了个底朝天

娱乐圈笔娱君 浏览 861

比亚迪连续4个季度超越特斯拉

大象新闻 浏览 1240

寻找隐形冠军|意想不到的它

海外网 浏览 228

男子突然膝盖疼半夜紧急求医 医生一席话让他立即报警

社会奇闻君 浏览 66759

决战星期四:懂球帝6-3战胜超越足球俱乐部

懂球帝 浏览 871

梅根穿搭越来越时髦 一双旧鞋穿出新造型

潮人方法论 浏览 15471

丰田"世极"正式独立 全新概念车剑指劳斯莱斯

网易汽车 浏览 906
本站所有信息收集于互联网,如本站收集信息侵权,请联系我们及时删除
Copyright © 2020-2022,版权所有 qukanredian.com
沪ICP备20002587号-1