Transformer 作者创业后首个成果亮相!用文本指挥 AI 做表格发邮件,这是先给自己造了个员工?

大千世界 151 0

  集结了 Transformer 作者、前 OpenAI 工程副总裁的创业团队,不到半年就亮出首个大模型 ——

  Action Transformer(ACT-1)。

  简单来说,这是一个会使用浏览器、Excel 等软件工具的 AI。

  基于 Transformer 的自然语言处理能力,它能理解人类给出的命令,并完成相应操作。

  比如,想要在 Excel 表格中加上利润、利润率,只需把这段话输入给 AI,它就能自己在对应行列创建公式完成任务了。

  

Transformer 作者创业后首个成果亮相!用文本指挥 AI 做表格发邮件,这是先给自己造了个员工?-第1张图片-大千世界


  想要在网上找房子,也不用自己搜索再设置各种筛选条件了。

  只需要告诉 AI:帮我在休斯顿找一套四口之家住的房子,预算在 60 万。

  然后 AI 就能一气呵成找到目标范围内的房源了。

  

Transformer 作者创业后首个成果亮相!用文本指挥 AI 做表格发邮件,这是先给自己造了个员工?-第2张图片-大千世界


  整个过程非常丝滑连贯,看上去比自己手动操作要快上很多。

  最大的好处就是不用自己来操作了,“吆喝”一声即可,属实是懒癌福音。

  团队表示,他们认为人类在电脑上的各种操作,通用人工智能也能搞定,ACT-1 正是他们朝这个方向迈出的第一步。

  

Transformer 作者创业后首个成果亮相!用文本指挥 AI 做表格发邮件,这是先给自己造了个员工?-第3张图片-大千世界


  让 AI 来帮助人机交互

  从官方目前公布的功能来看,这个 AI 像是 Siri、微软小娜的究极加强版。

  它的优势在于帮人们省去了很多繁杂的操作,比如在网页上填信息表格,鼠标不操作个十几次很难搞定。

  但是如果用 AI,只需输入一句话。

  

Transformer 作者创业后首个成果亮相!用文本指挥 AI 做表格发邮件,这是先给自己造了个员工?-第4张图片-大千世界


  而且 AI 的操作并不局限在一个网页。

  让它找个一千块以下的冰箱并联系卖家,AI 先从购物平台上检索,然后自己打开邮箱写邮件。

  

Transformer 作者创业后首个成果亮相!用文本指挥 AI 做表格发邮件,这是先给自己造了个员工?-第5张图片-大千世界


  遇到自己不懂的事情,还知道上维基百科搜索一番。

  

Transformer 作者创业后首个成果亮相!用文本指挥 AI 做表格发邮件,这是先给自己造了个员工?-第6张图片-大千世界


  即便是操作失误了,也能根据人类给出的教程指导快速学习。

  这不,一开始弄成乱码的 Excel 表格,在学习了正确的公式后,AI 很快给出了正确的操作。

  

Transformer 作者创业后首个成果亮相!用文本指挥 AI 做表格发邮件,这是先给自己造了个员工?-第7张图片-大千世界


  总之就是把日常我们用电脑时的一些繁琐小事,交给 AI 来办。

  正如公司创始人兼 CEO David Luan 所说,他们希望由 AI 来完成一些琐碎的基础电脑操作,让人类更专注于自己的工作。

  研发团队表示,他们是通过将 ACT-1 连接在一个 Chrome 扩展程序上,让它来观察浏览器的一些操作,比如点击、输入、滚动等。

  目前来看 ACT-1 还有很多进步空间。团队希望它最终的操作速度可以达到人类察觉不到的水平。

  值得一提的是,想让 AI 来充当人类电脑操作助手的,并非 Adept 一家。

  今年 2 月,DeepMind 发表了一篇论文,表示他们利用数据驱动的方法,让 AI 学习到人类操作电脑的方式,从而让它们完成订机票等任务。

  

Transformer 作者创业后首个成果亮相!用文本指挥 AI 做表格发邮件,这是先给自己造了个员工?-第8张图片-大千世界


  DeepMind 表示,他们训练的 AI 可以完成 100 多项任务,并且都达到了人类水平。

  此外,由 DeepMind 联合创始人穆斯塔法等人创立的 Inflection AI,也是想以 AI 的方式,重新定义人机交互。

  超豪华主创团队

  ACT-1 的打造者是 Adept,今年 4 月官宣成立。

  天使轮便拿下 6500 万美元融资,投资人包括 Uber CEO、特斯拉自动驾驶负责人、Airtable 创始人等。

  

Transformer 作者创业后首个成果亮相!用文本指挥 AI 做表格发邮件,这是先给自己造了个员工?-第9张图片-大千世界


  创始团队阵容非常豪华。

  首席科学家是 Ashish Vaswani。他是《Attention is all you need》的第一作者,平常看论文时经常出现的“(Vaswani et al., 2017)”就是这位大佬。

  他博士毕业于南加州大学,在谷歌大脑工作已有 5 年。

  

Transformer 作者创业后首个成果亮相!用文本指挥 AI 做表格发邮件,这是先给自己造了个员工?-第10张图片-大千世界


  Transformer 的另一位作者 Niki Parmar 也加入了该团队。

  她在印度上完大学后,同样在南加州大学读完硕士,在谷歌工作了近 7 年。

  

Transformer 作者创业后首个成果亮相!用文本指挥 AI 做表格发邮件,这是先给自己造了个员工?-第11张图片-大千世界


  创始人兼 CEO David Luan,是前 OpenAI 加州实验室工程副总裁,参与过 GPT-2、GPT-3、CLIP、DALL-E 等模型的开发,后来加入谷歌,曾任谷歌大脑大模型研究的 Director。

  

Transformer 作者创业后首个成果亮相!用文本指挥 AI 做表格发邮件,这是先给自己造了个员工?-第12张图片-大千世界


  除了以上几位,团队人员还包括:

  Kelsey Schroeder,斯坦福大学计算数学(computational mathematics )专业硕士,前谷歌大模型生产 infra 的产品负责人;

  Anmol Gulati,在谷歌主要做语音识别模型;

  Augustus Odena,在谷歌领导大型语言模型相关的工作,也有不少图像合成方面的研究;

  Erich Elsen,机器学习和高性能计算交叉领域的研究人员,前 Deepmind 员工,主要研究大模型,在更早之前,还分别在谷歌和百度(硅谷 AI Lab)干了两年;

  Fred Bertsch,谷歌数据和协作人工智能系统方面的专家。

  最后一位,Maxwell Nye,是刚从 MIT 毕业的一位博士生,研究重点为自动代码生成。

  总的来说,可谓大佬云集,且各有专攻。

  目前,Adept 的最新成果 ACT-1 还没有对外开放使用,但可以在官网排队了~

  以及团队正在招聘人才,感兴趣的小伙伴可以关注一下子。

  参考链接:

  [1]https://twitter.com/AdeptAILabs/status/1570144499187453952

  [2]https://techcrunch.com/2022/04/26/2304039/


标签: AI

抱歉,评论功能暂时关闭!