ChatGPT上线全新功能Canvas，这是OpenAI融资66亿美元的底气？

chatgpt2024-10-07 13:04:38594

先做个广告：如需代注册ChatGPT或充值 GPT4.0会员（plus），请添加站长微信：gptchongzhi

在OpenAI宣布获得创纪录的66亿美元融资的第二天，公司又重磅推出了自ChatGPT发布以来的首个重大界面更新—“Canvas（画布）”。

推荐使用GPT中文版,国内可直接访问：https://ai.gpt86.top

Canvas是一个用于在写作和编程项目上与ChatGPT协作的新界面，超越了简单的聊天。Canvas会在一个单独的窗口中打开，让你和ChatGPT可以在项目上进行合作。这个早期的测试版引入了一种全新的协作方式——不仅仅通过对话，而是通过并肩创作和完善想法。

Canvas当前主要专注于解决用户在写作和代码编写方面使用chatGPT的场景。

人们每天都使用ChatGPT来帮助写作和编写代码。虽然聊天界面易于使用，并且适用于许多任务，但在需要进行编辑和修订的项目上，它的功能有限。Canvas为这类工作提供了一个全新的界面。

使用Canvas写作，ChatGPT可以更好地理解你要完成的任务的上下文。你可以高亮显示特定部分，明确指出你希望ChatGPT专注的内容。就像一个文稿编辑或代码审阅员，它能够根据整个项目提供反馈和建议。

Canvas还提供了一个快捷菜单，让你请求ChatGPT调整写作长度、调试代码或快速执行其他有用的操作。你也可以通过Canvas中的返回按钮恢复之前的工作版本。

写作快捷菜单包括：

建议修改：ChatGPT提供行内建议和反馈。
调整长度：将文档的长度缩短或延长。
改变阅读水平：调整阅读水平，从幼儿园到研究生。
最终润色：检查语法、清晰度和一致性。
添加表情符号：添加相关的表情符号，以增强强调和色彩。

而编程是一个反复迭代的过程，在聊天界面中很难跟踪所有的代码修改。使用Canvas编程，Canvas让你更容易跟踪和理解ChatGPT的更改。

编程快捷菜单包括：

审查代码：ChatGPT提供行内建议以改进代码。
添加日志：插入打印语句，帮助你调试和理解代码。
添加注释：为代码添加注释，使其更易于理解。
修复错误：检测并重写有问题的代码以解决错误。
移植到其他语言：将代码转换为JavaScript、TypeScript、Python、Java、C++或PHP。

如何训练模型成为一个协作者

OpenAI团队训练了GPT-4o，让它能够像一个创意伙伴一样与用户协作。这个模型可以在适当的时候自动打开Canvas进行修改，甚至完全重写内容。它还能够理解更广泛的背景，从而提供精准的反馈和建议。

为了实现这些功能，研究团队开发了以下几个核心行为：

在写作和编程时自动触发Canvas
生成多种类型的内容
进行针对性修改
重写文档
提供行内反馈

团队通过20多项自动化评估来测试模型的进展，并使用了新的数据生成技术，比如从OpenAI o1-preview中提取输出，来进一步训练模型。这种方法可以快速提升写作质量和改善用户交互体验，且无需依赖人工生成的数据。

一个主要的挑战是确定何时触发Canvas。团队教会模型在遇到像“写一篇关于咖啡豆历史的博客文章”这样的提示时自动打开Canvas，而在像“帮我做一道晚餐菜”的简单问答场景中避免过度触发。对于写作任务，团队重点提高了正确触发的准确率，达到了83%，相比之前的模型有明显提升。

值得注意的是，模型的表现对不同提示非常敏感。换句话说，不同的提示可能导致表现不一致。例如，在编程和写作任务中可能都会出现错误，因此团队特意让模型在编程任务中减少触发Canvas的频率，以避免打扰高级用户。后续将根据用户反馈继续优化这些功能。

在写作和编码任务中，团队通过正确触发画布决策边界，将准确率分别提高到了83%和94%，与基线零样本GPT-4o模型相比，后者仅使用提示指令。

第二个挑战涉及调整模型在触发画布后的编辑行为——具体来说，是决定何时进行针对性编辑与重写整个内容。团队训练模型在用户通过界面显式选择文本时进行针对性编辑，否则倾向于重写。随着团队对模型的不断优化，这种行为也在不断发展。

在写作和编码任务中，我们优先改进了针对画布的编辑。带有画布的GPT-4o的表现比基线提示GPT-4o高出18%。

最后，训练模型以生成高质量的评论需要仔细迭代。与前两种情况不同，前两者可以很容易地适应于通过彻底的手动审查进行自动化评估，而以自动化方式衡量质量尤其具有挑战性。因此，需要使用人工评估来评估评论的质量和准确性。集成画布模型在准确性方面比基线零样本GPT-4o高出30%，在质量方面高出16%，表明与详细指令的零样本提示相比，合成训练显著提高了响应质量和行为。

人类评估测试了画布评论的质量和准确性功能。画布模型在准确性方面比基线零样本GPT-4o高出30%，在质量方面高出16%。

如何使用Canvas

至于Canvas的使用权限，OpenAI在10月3日已经向全球 ChatGPT Plus 和 Team 用户推出 Canvas。企业版和教育版用户将于下周获得访问权限。同时计划在测试版结束后向所有 ChatGPT Free 用户提供 Canvas。

你可以在模型选择器中手动选择进行体验，或者当ChatGPT检测到某种情况可能需要Canvas时，它会自动打开。你也可以在提示中包含“使用Canvas”来手动打开Canvas，并利用它处理现有项目。

作者评论：

Canvas的推出对于OpenAI来讲只是一个小的功能迭代，但是有可能意义非凡。OpenAI以往并没有花费太多精力在应用端产品的完善上，它的核心竞争优势是背后的大模型，并以此为基础提供企业级的API调用服务，目的是让AI的应用都建立在OpenAI训练的大模型基础上，而自己就是那个AI宇宙的核心。但是随着各家竞争对手尤其是免费开源大模型的日益完善与强大，其他大模型与GPT的差距越来越小，甚至在某些领域还超越了GPT，这会让OpenAI的原来的商业路径受到阻碍，因此我想团队有可能会朝着模型和应用一体化的道路进行构建，类似于苹果的ios系统和苹果产品生态。

所以，接下来OpenAI会在继续完善和迭代自己大模型的基础上，也会在应用自家大模型构建AI产品的道路上越走越远。而近期66亿美元融资1570亿美元的估值也是对这条道路的肯定吧。

就像OpenAI在官网上讲的，要让人工智能更加实用和易于使用，我们需要重新思考我们与人工智能的互动方式。而作为开启和引领新AI时代的浪潮的OpenAI，让我们继续给予期待和祝福吧！