首先从字数上看,Claude 恐怕就没有合格,WPS 的检测结果显示这篇文章的字数为 646,离 800 字还有一些距离。不过,从内容上看,Claude 确实是给出了不同于国产 AI 的解答,它从人类本身出发,以冒险基因和进取精神为核心,解读了人类为什么要探索陌生世界。 从立意上来说,Claude 或许是目前出场的 AI 中最高的,不仅仅是讲到人类,更是将话题拓展到了文明的发展与延续、人类的未来等方面,让人不禁有种 " 不明觉厉 " 的感觉。
不过,考虑到命题更多的是对个体想法的探索,虽然文章内容不错,但是恐怕也拿不到满分或是特别高的分数。
最后,就让我们来看看 ChatGPT 的回答吧,鉴于时间关系,小雷最终是在 New Bing 上得到的答复。
不得不说,New Bing 给出的文章是所有回答中最长的,字数高达 1144 个,考虑到文科答卷的作文答题区大小,恐怕会超出限制,卷面分和文章本身的分数都会因此大打折扣。
至于文章本身,New Bing 选择从人类本身去探讨这个问题,然后分别从求知欲、创造欲、竞争欲、自我实现等方面来讨论人类为什么要探索陌生世界,立意方面也是与 Claude 相似,喜欢从人类角度来思考这个问题。 从这里其实就可以看出海内外生成式 AI 在逻辑上的区别,在面对相同的问题时,海外的 AI 有时候会倾向于从一个更大的层面上去进行解读,而国内的 AI 则更加扣题,选择从个人角度出发进行解读。
我认为两者存在差异的原因主要有两点:一是海外的训练数据与国内的训练数据不同;二是对中文问题的理解不同,国内的中文互联网有着过去历年的高考题目,所以 AI 在看到类似的题目时,会优先与相近的数据进行匹配,最终写出一篇类似于高考作文的成品,而海外的 AI 则是将其看做对 " 人类探索陌生世界 " 问题的解读,所以选择从一个更广泛的角度进行回答。
至于哪个 AI 的文章更好,或许就因人而异了,喜欢科幻、喜欢宏大叙事的读者,或许会更喜欢 " 洋和尚 " 的文章,从个人角度来说的话,国内的 AI 则表现得更好一些。
在本次的高考作文中,北京卷是给出了两个命题,考生可以二选一进行作答,那么对于 AI 来说,它们遇到 " 选择题 " 时,又会给出怎样的回答呢?
首先是讯飞星火。