在与 open ai 的合并邀请中anthropic非常稳健的发布了 2.1模型,claude 2.1升级主要包括下面几个方面200k token 的上下文窗口、模型幻觉率的显着降低、系统提示以及新测试功能:工具使用。
200k 上下文窗口:限制为 200,000 个token,即大约 150,000 个单词或超过 500 页的材料。用户现在可以上传整个代码库等技术、s-1 等财务报表,甚至是《伊利亚特》或《奥德赛》等长篇文学作品。通过能够与大量内容或数据进行交互,claude 可以进行总结、执行问答、预测趋势、比较和对比多个文档等等。
模型幻觉显著降低:与之前的 claude 2.0 模型相比,虚假陈述减少了 2 倍。这使企业能够构建高性能的人工智能应用程序,解决具体的业务问题,并以更高的信任度和可靠性在其运营中部署人工智能。claude 2.1 在理解和总结方面也做出了有意义的改进,特别是对于需要高精度的长而复杂的文档,例如法律文件、财务报告和技术规范。在评估中,claude 2.1 证明错误答案减少了 30%,并且错误地得出文档支持特定主张的比率降低了 3-4 倍。
api工具使用:claude 现在可以跨开发人员定义的函数或 api 进行编排、搜索网络资源以及从私有知识库检索信息。用户可以定义一组工具供 claude 使用并指定请求。然后,模型将决定需要哪种工具来完成任务并代表他们执行操作。
系统提示:允许用户向 claude 提供自定义指令以提高性能。系统提示设置有用的上下文,增强claude承担特定个性和角色的能力,或以更可定制、符合用户需求的一致方式构建响应。
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/yun268040.html