老马的 xai grok-2 beta 版本。在lmsys的成绩超过了claude 3.5 sonnet 和 gpt-4-turbo。
grok-2 和 grok-2 mini 目前在 𝕏 上测试,这个月可以通过 api 使用。
𝕏 上的 grok 界面也获得了更新,𝕏 premium 和 premium 用户都可以访问新模型。图片生成能力用的最近非常火的 flux 图像生成模型。
xai 还说他们内容使用类似lmsys的流程来对模型进行评估,在每次互动中,ai 导师模型会看到 grok 生成的两个回应。根据指南中概述的具体标准选择更优秀的回应。专注于评估模型在两个关键领域的能力:遵循指示和提供准确的事实信息。
grok-2 在推理检索内容和工具使用能力方面显示出显著改进,例如正确识别缺失信息、推理事件序列以及丢弃无关的帖子。
这一点在结合推特内容分析上明显变好了,你可以让 grok 分析你的内容以及互动来改善账号的运营情况。
他们下一步将会发布 grok 多模态模型的预览。
原创文章,作者:校长,如若转载,请注明出处:https://www.yundongfang.com/yun299412.html