本文转载自:量子位(ID:QbitAI),作者:梦晨 杨净 发自 凹非寺。猎云网已获授权。
都说ChatGPT是AI的“iPhone时刻”,现在属于它的“应用商店”来了。
OpenAI刚刚又甩出一个王炸——宣布推出插件功能,赋予ChatGPT使用工具、联网、运行计算的能力。
例如在官方演示中,ChatGPT一旦接入数学知识引擎Wolfram Alpha,就再也不用担心数值计算不精准的问题。
并且还开放了OpenAI自己的两个插件:网络浏览器和代码解释器。
以前因为不联网,用户只能查询到2021年9月之前的消息;但现在不仅能直接检索到最新新闻,就连数理计算也一并解决了!
(再也不用担心ChatGPT胡说八道了!)
另外也支持个人或企业把私有数据(文档、笔记、邮件等)投喂给ChatGPT,成为人的“第二大脑”或企业的智能助理。
一闪而过的3页第三方插件列表中,还包括:
让ChatGPT查询世界各国语言词汇、短语意思
让ChatGPT查询航班、酒店信息,帮你规划差旅
让ChatGPT访问各大电商数据,帮你比价甚至直接下单
让ChatGPT接入自动化平台Zapier,与几乎所有办公软件连接,创建专属自己的智能工作流
……
而这只是一个开始,制作插件的权限和方法,同样会向开发者开放。
一位资深程序员感叹:
我为许多软件开发过插件系统,ChatGPT插件接口可能是我一生中见过的最疯狂、最令人印象深刻的。
刚刚回归OpenAI不久的特斯拉前AI主管Andrej Karpathy则表示:
GPT类模型是一种运行在文本上的新型计算机架构,它不仅可以与我们人类交谈,也可以与现有的软件基础设施“交谈”,API是第一步,插件是第二步。
ChatGPT有了眼睛和耳朵
按照官方介绍,这个插件功能主要是以安全为核心原则的语言模型设计工具
(嗯,换言之,就是不会让你那么快使用。)
OpenAI这波还是得先让用户加入候补名单。
不过他们也说,虽然现在处于Alpha阶段,优先考虑一些少数开发人员和ChatGPT Plus用户,但他们也打包票:
更大规模的开放,只是一个时间问题。
在目前已实现的“初步功能”来看,ChatGPT已经可以具备了三项能力:
访问最新信息,比如体育比分、股票价格、最新消息;
检索知识库信息,比如公司文件、个人笔记、运行计算;
代表用户执行操作,比如订机票、订餐。
目前已支持的第三方插件,可以看到有餐厅推荐、旅行计划、购物、AI语言老师、网上店铺,以及学术界知识应用Wolfram、应用库(与5000多个应用程序交互,包括Google表格)……
这样看起来,几乎已经涵盖了我们生活中的衣食住行、工作与学习。
除此之外,OpenAI自己也有两种插件:网络浏览器和代码解释器,并开源了一个知识库检索插件的代码。
前面提到,OpenAI此次非常强调安全原则,对此他们实施了多项保障措施,且都是一对一针对功能的。
1、第三方插件
首先是针对第三方插件,任何开发人员都可以自行参与构建,OpenAI甚至还给出了一整套构建流程:“如何在ChatGPT构建你的插件”,并在Github上已开源。
在ChatGPT上面的显示是这样的,用户可以自行选择插件并下载。
随后就可以在聊天界面上使用了。
2、联网。
你能告诉我,哪个人、哪部电影获得了这些类别的奥斯卡?
结果可以看到,ChatGPT在聊天界面就多出来“浏览”结果,直接得到了最新2023年的结果。
OpenAI所做的安全措施包括:用户使用这一插件的范围只限定在检索信息,并不包括“事务性操作”,比如表单提交;使用的是必应检索API继承了微软在信息来源上面的可靠性和真实性;在独立服务器中运行;显示来源等。
3、代码解释器:可以使用Python处理上传和下载的实验性ChatGPT模型。
简单来说,就是提供了一个在沙盒、防火墙执行环境中工作的 Python 解释器,以及一些临时磁盘空间。
由解释器插件运行的代码在一个持久会话中进行评估,并且后续调用可以相互构建。目前该功能支持将文件上传到当前对话工作区并下载工作结果。
不过OpenAI这边表示,这一代码解释器主要还是提供计算机的一些最基本的功能,让一些初级程序员和爱好者提供更顺滑的接口。
目前推荐的功能包括:
解决定量和定性的数学问题
进行数据分析和可视化
在格式之间转换文件
One More Thing
对于ChatGPT新推出插件功能,有开发者表示这基本提供了苹果应用商店式的服务。
但也有人提出,目前还没有看到开发者的获利模式。
批评者则认为,OpenAI刚刚杀死了一个创业公司LangChain,如果像这样下去反而会阻碍了创新。
LangChain提供了利用语言模型API快速构建应用程序的Python框架,刚刚获得1000万美元种子轮融资。
你认为OpenAI会成为AI时代的苹果吗?谁又会是AI时代的安卓?