在OpenAI宣布获得创纪录的66亿美元融资的第二天,公司又重磅推出了自ChatGPT发布以来的首个重大界面更新—“Canvas(画布)”。
Canvas是一个用于在写作和编程项目上与ChatGPT协作的新界面,超越了简单的聊天。Canvas会在一个单独的窗口中打开,让你和ChatGPT可以在项目上进行合作。这个早期的测试版引入了一种全新的协作方式——不仅仅通过对话,而是通过并肩创作和完善想法。
Canvas当前主要专注于解决用户在写作和代码编写方面使用chatGPT的场景。
人们每天都使用ChatGPT来帮助写作和编写代码。虽然聊天界面易于使用,并且适用于许多任务,但在需要进行编辑和修订的项目上,它的功能有限。Canvas为这类工作提供了一个全新的界面。
使用Canvas写作,ChatGPT可以更好地理解你要完成的任务的上下文。你可以高亮显示特定部分,明确指出你希望ChatGPT专注的内容。就像一个文稿编辑或代码审阅员,它能够根据整个项目提供反馈和建议。
Canvas还提供了一个快捷菜单,让你请求ChatGPT调整写作长度、调试代码或快速执行其他有用的操作。你也可以通过Canvas中的返回按钮恢复之前的工作版本。
写作快捷菜单包括:
建议修改:ChatGPT提供行内建议和反馈。
调整长度:将文档的长度缩短或延长。
改变阅读水平:调整阅读水平,从幼儿园到研究生。
最终润色:检查语法、清晰度和一致性。
添加表情符号:添加相关的表情符号,以增强强调和色彩。
而编程是一个反复迭代的过程,在聊天界面中很难跟踪所有的代码修改。使用Canvas编程,Canvas让你更容易跟踪和理解ChatGPT的更改。
编程快捷菜单包括:
审查代码:ChatGPT提供行内建议以改进代码。
添加日志:插入打印语句,帮助你调试和理解代码。
添加注释:为代码添加注释,使其更易于理解。
修复错误:检测并重写有问题的代码以解决错误。
移植到其他语言:将代码转换为JavaScript、TypeScript、Python、Java、C++或PHP。
如何训练模型成为一个协作者
OpenAI团队训练了GPT-4o,让它能够像一个创意伙伴一样与用户协作。这个模型可以在适当的时候自动打开Canvas进行修改,甚至完全重写内容。它还能够理解更广泛的背景,从而提供精准的反馈和建议。
为了实现这些功能,研究团队开发了以下几个核心行为:
在写作和编程时自动触发Canvas
生成多种类型的内容
进行针对性修改
重写文档
提供行内反馈
团队通过20多项自动化评估来测试模型的进展,并使用了新的数据生成技术,比如从OpenAI o1-preview中提取输出,来进一步训练模型。这种方法可以快速提升写作质量和改善用户交互体验,且无需依赖人工生成的数据。
一个主要的挑战是确定何时触发Canvas。团队教会模型在遇到像“写一篇关于咖啡豆历史的博客文章”这样的提示时自动打开Canvas,而在像“帮我做一道晚餐菜”的简单问答场景中避免过度触发。对于写作任务,团队重点提高了正确触发的准确率,达到了83%,相比之前的模型有明显提升。
值得注意的是,模型的表现对不同提示非常敏感。换句话说,不同的提示可能导致表现不一致。例如,在编程和写作任务中可能都会出现错误,因此团队特意让模型在编程任务中减少触发Canvas的频率,以避免打扰高级用户。后续将根据用户反馈继续优化这些功能。
在写作和编码任务中,团队通过正确触发画布决策边界,将准确率分别提高到了83%和94%,与基线零样本GPT-4o模型相比,后者仅使用提示指令。
第二个挑战涉及调整模型在触发画布后的编辑行为——具体来说,是决定何时进行针对性编辑与重写整个内容。团队训练模型在用户通过界面显式选择文本时进行针对性编辑,否则倾向于重写。随着团队对模型的不断优化,这种行为也在不断发展。
在写作和编码任务中,我们优先改进了针对画布的编辑。带有画布的GPT-4o的表现比基线提示GPT-4o高出18%。
最后,训练模型以生成高质量的评论需要仔细迭代。与前两种情况不同,前两者可以很容易地适应于通过彻底的手动审查进行自动化评估,而以自动化方式衡量质量尤其具有挑战性。因此,需要使用人工评估来评估评论的质量和准确性。集成画布模型在准确性方面比基线零样本GPT-4o高出30%,在质量方面高出16%,表明与详细指令的零样本提示相比,合成训练显著提高了响应质量和行为。
人类评估测试了画布评论的质量和准确性功能。画布模型在准确性方面比基线零样本GPT-4o高出30%,在质量方面高出16%。
至于Canvas的使用权限,OpenAI在10月3日已经向全球 ChatGPT Plus 和 Team 用户推出 Canvas。企业版和教育版用户将于下周获得访问权限。同时计划在测试版结束后向所有 ChatGPT Free 用户提供 Canvas。
你可以在模型选择器中手动选择进行体验,或者当ChatGPT检测到某种情况可能需要Canvas时,它会自动打开。你也可以在提示中包含“使用Canvas”来手动打开Canvas,并利用它处理现有项目。
作者评论:
Canvas的推出对于OpenAI来讲只是一个小的功能迭代,但是有可能意义非凡。OpenAI以往并没有花费太多精力在应用端产品的完善上,它的核心竞争优势是背后的大模型,并以此为基础提供企业级的API调用服务,目的是让AI的应用都建立在OpenAI训练的大模型基础上,而自己就是那个AI宇宙的核心。但是随着各家竞争对手尤其是免费开源大模型的日益完善与强大,其他大模型与GPT的差距越来越小,甚至在某些领域还超越了GPT,这会让OpenAI的原来的商业路径受到阻碍,因此我想团队有可能会朝着模型和应用一体化的道路进行构建,类似于苹果的ios系统和苹果产品生态。
所以,接下来OpenAI会在继续完善和迭代自己大模型的基础上,也会在应用自家大模型构建AI产品的道路上越走越远。而近期66亿美元融资1570亿美元的估值也是对这条道路的肯定吧。
就像OpenAI在官网上讲的,要让人工智能更加实用和易于使用,我们需要重新思考我们与人工智能的互动方式。而作为开启和引领新AI时代的浪潮的OpenAI,让我们继续给予期待和祝福吧!
网友评论