Published

- 1 min read

[AI]DeepSeek-R1 模型发布且开源,性能对标 OpenAI o1 正式版

Thumbnail

DeepSeek-R1 性能概览

DeepSeek-R1 在多个领域展现出强大的性能,以下是其在各个方面的具体表现:

综合性能 (Average: 73.9, 排名第二)

模型 (Model)综合得分 (Average)编程 (Coding)数据分析 (Data Analysis)指令跟随 (Instruction Following)语言 (Language)数学 (Math)推理 (Reasoning)
DeepSeek-Reasoner73.965.771.887.053.779.985.3

数学 (Math: 79.9, 排名第二)

模型 (Model)AMPS_Hardmath_compolympiad
DeepSeek-Reasoner83.091.66764.923

编程 (Coding: 65.7, 排名第三)

模型 (Model)LCB_generationcoding_completion
DeepSeek-Reasoner83.33348.0

推理 (Reasoning: 85.3, 排名第二)

模型 (Model)spatialweb_of_lies_v2zebra_puzzle
DeepSeek-Reasoner78.098.080.0

语言 (Language: 53.7, 排名第三)

模型 (Model)connectionsplot_unscramblingtypos
DeepSeek-Reasoner74.16743.04644.0

数据分析 (Data Analysis: 71.8, 排名第一)

模型 (Model)ctatablejointablereformat
DeepSeek-Reasoner64.061.4690.0

指令跟随 (Instruction Following: 87.0, 排名第一)

模型 (Model)paraphrasesimplifystory_generationsummarize
DeepSeek-Reasoner88.7585.46788.085.6