实测国产ChatGPT——讯飞星火认知大模型

上周小编分享了关于申请讯飞星火认知大模型的内测流程。内测申请成功以后,大家接着最关注的就是讯飞星火认知大模型实际使用起来到底如何?根据5月初发布会现场公布的星火7大核心能力,小编对其进行了实测。以下是本次实测的详细内容。

1.文本生成

这次小编放弃了续写故事等比较常见的测试任务。首先让星火制定一份中学生研学游方案,星火的生成速度非常快,几乎是立刻就给出了反应。从方案内容来看,包括目的地选择、行程安排、费用预算等,整体也是比较完善的。

讯飞星火认知大模型

接着,又让星火撰写一篇新闻稿。语言精练、用词准确,但是篇幅过短。大家在输入问题的时候可以提出字数限制要求,更易得到自己想要的文本。

讯飞星火认知大模型

2.语言理解

小编提问了“大丈夫宁死不屈”和“大丈夫,能屈能伸”这两句话哪句是对的?

星火对这两句话分别进行了解释,最后阐释了这两句话的使用场景。可见,星火对于中国谚语的理解还是比较深厚的。

讯飞星火认知大模型

小编接着设定了“女朋友生气”的前提,然后询问星火应该坚持“大丈夫宁死不屈”还是“大丈夫,能屈能伸”。

星火的求生欲还是很强的,提示应该表达出对女朋友的重视和关心,让女朋友感受到诚意和真心。

讯飞星火认知大模型

3.知识问答

在知识问答方面,星火和其他国产语言大模型的能力不相上下。普通的百科问题几乎都可以顺利回答出来。小编特意询问了一些泛生活领域的问题。

例如,小孩子为什么要去上幼儿园?孩子应该和爸爸姓还是和妈妈姓?星火都给出了比较客观的答案,并且所列出的原因逻辑性也比较强。

讯飞星火认知大模型

讯飞星火认知大模型

4.逻辑推理

逻辑推理是很多大模型最容易“翻车”的领域,毕竟相对于人脑来说,各大模型的逻辑能力还是有一定差距的,这也可以理解。小编输入过河的逻辑推理问题,星火倒是给出了正确的答案。想要了解星火更多逻辑推理问答的话,大家可以多输入问题尝试。

讯飞星火认知大模型

5.数字能力

在5月初的星火发布会上,当时就提到了讯飞星火大模型的数学能力很强,能够达到ChatGPT的水平。现场测试中,星火顺利解出了一个计算三类花朵数量的题目。在实测过程中,小编输入了计算三角形面积的题目。星火列出了解题步骤,一目了然。

讯飞星火认知大模型

6.编程能力

在官方介绍中,星火认知大模型不仅可以生成代码,还可以修改、理解、编译代码,并且还具备Python、Java等多语言能力。在实测中,星火也针对问题给出了回答。根据很多程序员介绍,星火的编程能力还是非常不错的,偶尔会有漏洞出现。

讯飞星火认知大模型

7.多模态输入和表达能力

在多模态方面,讯飞星火大模型现在仅支持文字、语音两种输入方面。根据此前发布会的信息,讯飞的多模态输入和表达能力最迟将在今年8月份上线,提供给用户使用。

讯飞星火认知大模型

总的来说,讯飞星火认知大模型使用起来还是非常不错的,也具备了和头部大模型竞争的实力。其次,星火带来的惊喜还有在商业化方面的落地,通过学习机、智能办公本、汽车座舱交互系统、讯飞听见、数字员工等一系列产品,打通了“大模型+产品”的生态闭环。关于讯飞星火认知大模型的更多进展,让我们共同期待。

服务商动态

ChatGPT八大插件汇总 超实用

2023-5-15 9:50:12

服务商动态

阿里云全新国际生态政策出炉 最高产品优惠幅度达40%

2023-5-15 11:50:39

相关推荐