当前位置：首页 >> 中医保健 >> GPT-4满分通过MIT本科课程数学考试！这套提示词火了

GPT-4满分通过MIT本科课程数学考试！这套提示词火了

发布时间：2024-02-04

这也就意味着，难以显然信息高度集中都的4550个问作序和技术细节，在GPT-4的受训高度集中都不发挥作用。

换句话说，如果GPT-4在可不受训期中早就受伤害到了这次的考作序们，那最后摘下完美局数，就只不过好惊艳的了。

也难怪乎有留言毫不客气地yygq，确认GPT-4获得这样的结果，一定是信息集早就包含在受训信息底下了。

第二个槽点，就是GPT-4最后100%的局数率，其实哪底下居然？？？

定睛一看，在学术著作的第2.6节有一句很关键的点：

设计团队在信息集上更正开源大建模，“也就是说问作序Q、基本事实解S和LLM究竟A，我们使用GPT-4自动对建模响应进行平均分”。

特别注意上，就是每个大建模分解成这次考生的究竟，然后派成GPT-4评委，分值在0-5二者之间。

所以给GPT-4打成总分的，实际上是GPT-4自己。

啊这……却是没有王婆卖瓜自卖自夸的嫌疑。

此外，关于要给GPT-4提供“好的定时”，才能让它超过总分优异成绩，也让许多人缠有微词。

到底什么不算“好的定时”呢？其实难以概念。

甚至有人喊着，无论如何把这些作序丢给MIT数学分析和EECS的同学去继续做，并促使给他们“好的定时”，这样有机体同学也能摘下100%的吧……

One More Thing

一个小小的彩蛋：

整个试验中都，基本上可以在笔记本电脑上部署运行的StableVicuna-13B，也有48%的局数率。

这个优异成绩，不仅比建模很大的LLaMA-65B高成近10个百分点，就连MIT fine-tuing天内的LLaMA-30B，还要高。

让人一再进一步面临一些关于建模规模与灵活性表征的思考

。

参考资料链接：[1][2][3][4]

— 完 —

相对论位 QbitAI · 太阳报号签约

关心我们，第一时间得知基础性科技动态

。

标签：