设为首页 - 加入收藏
您的当前位置:主页 > 娱乐 > 本文地址:http://www.duitang.net.cn/yule/2024/74027.html

关于鞭(biān)集(jí)使(shǐ)消息可靠吗?

时间:2024-03-11 来源:(原创/投稿/转载) 编辑:联络员

  谷歌Gemini 1.5突破100万个tokens,是GPT-4的近8倍,此外能处理长达1小时视频输入,这无疑是一记重拳,直指GPT-4的短板。

  Mistral则是开源阵营中黑马杀手,Mistral Large具有顶级推理能力,此前推出的Mistral 7B不仅表现超越Llama2,而且在手机上就能流畅运行,被视为GPT-4劲敌。

  而Anthropic的Claude 3 Opus,被认为是第一个明确胜过GPT-4的模型,其核心长文本处理能力得到进一步提升,而且GPT-4拿手好戏写代码也不在话下。

  最后一位Inflection的Inflection-2.5来势汹汹,在关键基准测试中与GPT-4并驾齐驱,还具有“世界级”实时网络搜索功能,广泛可用且获得用户高度满意度。

  总而言之,这些新贵们的出现无疑终结了GPT-4的一枝独秀,也预计着竞争激烈程度进入下一“白热化”阶段。

  此前,OpenAI首席执行官Sam Altman曾表态,自己的第一优先要务是发布下一代模型,但不一定就会叫GPT-5。

  ,焦点指向了所谓的“Q*”,一份53页PDF曝光,Q* 2025(GPT-8)原计划于2027年发布,旨在实现完全的AGI, 届时IQ将达到145万亿参数,100万亿参数即可达到人类水平。

  在摩根士丹利3月8日TMT大会上,大摩观察到生成式AI工具的创新速度正在加快,Altman表示

  ,类似于GPT-3到GPT-4的转变,推理能力是GPT-5的重点提升方向。微软也预计,M365 Copilot的功能和创新将几乎每天都在改进,但创新的顶峰尚未到来。

  GPT-5将是一个多模态模型,支持语音、图像、代码和视频,并在个性化和定制化功能方面实现重大更新,具备更强的推理能力和更高的准确性。

  首先是多模态,据Altman介绍GPT-5不仅支持文本输入,还支持语音、图像、代码和视频。分析预计GPT-5将是一个真正的多模态模型,类似于谷歌最近推出的新Gemini Ultra模型。

  其次个性化方面,Altman强调,GPT-4.5或GPT-5预计将在个性化和定制化功能方面实现重大更新,最关键的增强部分将围绕理解个人偏好的能力,比如整合用户信息、电子邮件、日历、约会偏好,以及与外部数据源建立联系。

  最后是推理能力和准确性,Altman表示,如果GPT-4目前解决了人类任务的10%,GPT-5应该是15%或者20%。当前大模型的通病——幻觉问题也将在GPT-5中得到解决。

  此外,Altman还指出,OpenAI API也将继续变得更快、更可靠、更便宜,但性能和成本之间始终存在平衡,奥特曼这里再次用iPhone来举例说明:尽管电池技术已显着改进,但iPhone 仍将保持 1-1.5 天的电池寿命以优化性能。

  另外在被要求指出一件GPT-5能做的令人惊讶的事情时,奥特曼回答:如果我必须选一件,那就是写作会变得更好。

栏目分类

本网转载作品的目的在于传递更多信息,并不代表本网赞同其观点或证实其内容的真实性,不承担此类作品侵权行为的直接责任及连带责任。

如涉及作品内容、版权等问题,请联系我们进行修改或删除!联系我们-

Top