国内外AI对比(一)

测试内容是,要求计算一段旅程的总花费:

机票8400

火车235

住宿340

接送400

第一天

吃饭600

按摩220

咖啡90

拍照180

杂费30

第二天 无

第三天

杂费125

零食80

打车40

火车酒吧100

第四天

打车150+12

这段旅程一共花了多少钱?


测试了ChatGPT4、Claude3 Opus、Kimi、通义千问、讯飞星火、字节豆包、文心一言、ChatGLM4

做对的有ChatGPT4、Claude3 Opus以及文心一言、ChatGLM4

ChatGPT4、Claude3 Opus明显答题质量更高,ChatGLM4效果也不错,文心一言啰里八嗦。