集结了 Transformer 作者、前 OpenAI 工程副总裁的创业团队,不到半年就亮出首个大模型 ——
Action Transformer(ACT-1)。
简单来说,这是一个会使用浏览器、Excel 等软件工具的 AI。
基于 Transformer 的自然语言处理能力,它能理解人类给出的命令,并完成相应操作。
比如,想要在 Excel 表格中加上利润、利润率,只需把这段话输入给 AI,它就能自己在对应行列创建公式完成任务了。

想要在网上找房子,也不用自己搜索再设置各种筛选条件了。
只需要告诉 AI:帮我在休斯顿找一套四口之家住的房子,预算在 60 万。
然后 AI 就能一气呵成找到目标范围内的房源了。

整个过程非常丝滑连贯,看上去比自己手动操作要快上很多。
最大的好处就是不用自己来操作了,“吆喝”一声即可,属实是懒癌福音。
团队表示,他们认为人类在电脑上的各种操作,通用人工智能也能搞定,ACT-1 正是他们朝这个方向迈出的第一步。

让 AI 来帮助人机交互
从官方目前公布的功能来看,这个 AI 像是 Siri、微软小娜的究极加强版。
它的优势在于帮人们省去了很多繁杂的操作,比如在网页上填信息表格,鼠标不操作个十几次很难搞定。
但是如果用 AI,只需输入一句话。

而且 AI 的操作并不局限在一个网页。
让它找个一千块以下的冰箱并联系卖家,AI 先从购物平台上检索,然后自己打开邮箱写邮件。

遇到自己不懂的事情,还知道上维基百科搜索一番。

即便是操作失误了,也能根据人类给出的教程指导快速学习。
这不,一开始弄成乱码的 Excel 表格,在学习了正确的公式后,AI 很快给出了正确的操作。

总之就是把日常我们用电脑时的一些繁琐小事,交给 AI 来办。
正如公司创始人兼 CEO David Luan 所说,他们希望由 AI 来完成一些琐碎的基础电脑操作,让人类更专注于自己的工作。
研发团队表示,他们是通过将 ACT-1 连接在一个 Chrome 扩展程序上,让它来观察浏览器的一些操作,比如点击、输入、滚动等。
目前来看 ACT-1 还有很多进步空间。团队希望它最终的操作速度可以达到人类察觉不到的水平。
值得一提的是,想让 AI 来充当人类电脑操作助手的,并非 Adept 一家。
今年 2 月,DeepMind 发表了一篇论文,表示他们利用数据驱动的方法,让 AI 学习到人类操作电脑的方式,从而让它们完成订机票等任务。

DeepMind 表示,他们训练的 AI 可以完成 100 多项任务,并且都达到了人类水平。
此外,由 DeepMind 联合创始人穆斯塔法等人创立的 Inflection AI,也是想以 AI 的方式,重新定义人机交互。
超豪华主创团队
ACT-1 的打造者是 Adept,今年 4 月官宣成立。
天使轮便拿下 6500 万美元融资,投资人包括 Uber CEO、特斯拉自动驾驶负责人、Airtable 创始人等。

创始团队阵容非常豪华。
首席科学家是 Ashish Vaswani。他是《Attention is all you need》的第一作者,平常看论文时经常出现的“(Vaswani et al., 2017)”就是这位大佬。
他博士毕业于南加州大学,在谷歌大脑工作已有 5 年。

Transformer 的另一位作者 Niki Parmar 也加入了该团队。
她在印度上完大学后,同样在南加州大学读完硕士,在谷歌工作了近 7 年。

创始人兼 CEO David Luan,是前 OpenAI 加州实验室工程副总裁,参与过 GPT-2、GPT-3、CLIP、DALL-E 等模型的开发,后来加入谷歌,曾任谷歌大脑大模型研究的 Director。

除了以上几位,团队人员还包括:
Kelsey Schroeder,斯坦福大学计算数学(computational mathematics )专业硕士,前谷歌大模型生产 infra 的产品负责人;
Anmol Gulati,在谷歌主要做语音识别模型;
Augustus Odena,在谷歌领导大型语言模型相关的工作,也有不少图像合成方面的研究;
Erich Elsen,机器学习和高性能计算交叉领域的研究人员,前 Deepmind 员工,主要研究大模型,在更早之前,还分别在谷歌和百度(硅谷 AI Lab)干了两年;
Fred Bertsch,谷歌数据和协作人工智能系统方面的专家。
最后一位,Maxwell Nye,是刚从 MIT 毕业的一位博士生,研究重点为自动代码生成。
总的来说,可谓大佬云集,且各有专攻。
目前,Adept 的最新成果 ACT-1 还没有对外开放使用,但可以在官网排队了~
以及团队正在招聘人才,感兴趣的小伙伴可以关注一下子。
参考链接:
[1]https://twitter.com/AdeptAILabs/status/1570144499187453952
[2]https://techcrunch.com/2022/04/26/2304039/
标签: AI