Skip to content

Run Bot for Metaculus AI Benchmark Tournament #22488

Run Bot for Metaculus AI Benchmark Tournament

Run Bot for Metaculus AI Benchmark Tournament #22488

Triggered via schedule March 5, 2026 07:23
Status Success
Total duration 2m 37s
Artifacts
precache_asknews
43s
precache_asknews
bot_claude_opus_4_6_high_32k  /  run_bot
46s
bot_claude_opus_4_6_high_32k / run_bot
bot_claude_haiku_4_5  /  run_bot
53s
bot_claude_haiku_4_5 / run_bot
bot_qwen3_max_thinking  /  run_bot
49s
bot_qwen3_max_thinking / run_bot
bot_kimi_k2_5_high  /  run_bot
56s
bot_kimi_k2_5_high / run_bot
bot_glm_5  /  run_bot
54s
bot_glm_5 / run_bot
bot_claude_opus_4_5_high_32k  /  run_bot
50s
bot_claude_opus_4_5_high_32k / run_bot
bot_claude_opus_4_5  /  run_bot
49s
bot_claude_opus_4_5 / run_bot
bot_gpt_5_2_high  /  run_bot
47s
bot_gpt_5_2_high / run_bot
bot_gpt_5_2  /  run_bot
51s
bot_gpt_5_2 / run_bot
bot_gemini_3_flash  /  run_bot
53s
bot_gemini_3_flash / run_bot
bot_glm_4_6  /  run_bot
57s
bot_glm_4_6 / run_bot
bot_kimi_k2_high  /  run_bot
46s
bot_kimi_k2_high / run_bot
bot_gpt_5_1_high  /  run_bot
54s
bot_gpt_5_1_high / run_bot
bot_gpt_5_1  /  run_bot
1m 0s
bot_gpt_5_1 / run_bot
bot_gemini_3_pro  /  run_bot
48s
bot_gemini_3_pro / run_bot
bot_grok_4_1_fast_high  /  run_bot
53s
bot_grok_4_1_fast_high / run_bot
bot_grok_4_1_fast  /  run_bot
44s
bot_grok_4_1_fast / run_bot
bot_claude_4_5_sonnet_high  /  run_bot
46s
bot_claude_4_5_sonnet_high / run_bot
bot_claude_4_5_sonnet  /  run_bot
50s
bot_claude_4_5_sonnet / run_bot
bot_qwen_3_max  /  run_bot
50s
bot_qwen_3_max / run_bot
bot_deepseek_3_2_reasoning  /  run_bot
48s
bot_deepseek_3_2_reasoning / run_bot
bot_grok_4_fast_high  /  run_bot
47s
bot_grok_4_fast_high / run_bot
bot_gpt_5_mini  /  run_bot
47s
bot_gpt_5_mini / run_bot
bot_gpt_5_nano  /  run_bot
45s
bot_gpt_5_nano / run_bot
bot_grok_4  /  run_bot
46s
bot_grok_4 / run_bot
bot_kimi_k2  /  run_bot
52s
bot_kimi_k2 / run_bot
bot_deepseek_r1_variance_test  /  run_bot
46s
bot_deepseek_r1_variance_test / run_bot
bot_gpt_oss_120b  /  run_bot
46s
bot_gpt_oss_120b / run_bot
bot_zai_glm_4_5  /  run_bot
47s
bot_zai_glm_4_5 / run_bot
bot_deepseek_v3_1_reasoning  /  run_bot
52s
bot_deepseek_v3_1_reasoning / run_bot
bot_deepseek_v3_1  /  run_bot
46s
bot_deepseek_v3_1 / run_bot
bot_deepseek_v3_1_variance_test_1  /  run_bot
49s
bot_deepseek_v3_1_variance_test_1 / run_bot
bot_deepseek_v3_1_variance_test_2  /  run_bot
54s
bot_deepseek_v3_1_variance_test_2 / run_bot
bot_gemini_2_5_pro_grounding  /  run_bot
48s
bot_gemini_2_5_pro_grounding / run_bot
bot_asknews_deepnews  /  run_bot
47s
bot_asknews_deepnews / run_bot
bot_deepseek_r1_exa_online_research_only  /  run_bot
46s
bot_deepseek_r1_exa_online_research_only / run_bot
bot_deepseek_r1_plus_exa_online  /  run_bot
1m 2s
bot_deepseek_r1_plus_exa_online / run_bot
bot_deepseek_r1_no_research  /  run_bot
52s
bot_deepseek_r1_no_research / run_bot
bot_gpt_4_1_optimized_prompt  /  run_bot
51s
bot_gpt_4_1_optimized_prompt / run_bot
bot_gpt_4_1_nano_optimized_prompt  /  run_bot
50s
bot_gpt_4_1_nano_optimized_prompt / run_bot
bot_deepseek_r1_sonar_pro  /  run_bot
52s
bot_deepseek_r1_sonar_pro / run_bot
bot_deepseek_r1_sonar  /  run_bot
48s
bot_deepseek_r1_sonar / run_bot
bot_deepseek_r1_sonar_reasoning_pro  /  run_bot
48s
bot_deepseek_r1_sonar_reasoning_pro / run_bot
bot_deepseek_r1_gpt_4o_search_preview  /  run_bot
53s
bot_deepseek_r1_gpt_4o_search_preview / run_bot
bot_deepseek_r1_gemini_2_5_pro_grounding  /  run_bot
48s
bot_deepseek_r1_gemini_2_5_pro_grounding / run_bot
bot_deepseek_r1_ask_exa_pro  /  run_bot
44s
bot_deepseek_r1_ask_exa_pro / run_bot
bot_o3  /  run_bot
51s
bot_o3 / run_bot
bot_o4_mini_high  /  run_bot
47s
bot_o4_mini_high / run_bot
bot_o4_mini  /  run_bot
58s
bot_o4_mini / run_bot
bot_4_1  /  run_bot
51s
bot_4_1 / run_bot
bot_4_1_mini  /  run_bot
51s
bot_4_1_mini / run_bot
bot_4_1_nano  /  run_bot
51s
bot_4_1_nano / run_bot
bot_gemini_2_5_flash  /  run_bot
53s
bot_gemini_2_5_flash / run_bot
bot_gpt4o  /  run_bot
47s
bot_gpt4o / run_bot
bot_gpt4o_mini  /  run_bot
53s
bot_gpt4o_mini / run_bot
bot_gpt3_5_turbo  /  run_bot
46s
bot_gpt3_5_turbo / run_bot
bot_llama_4_maverick_17b  /  run_bot
45s
bot_llama_4_maverick_17b / run_bot
bot_qwen_2_5_max  /  run_bot
45s
bot_qwen_2_5_max / run_bot
bot_deepseek_r1  /  run_bot
49s
bot_deepseek_r1 / run_bot
bot_deepseek_v3  /  run_bot
49s
bot_deepseek_v3 / run_bot
bot_grok_3_latest  /  run_bot
51s
bot_grok_3_latest / run_bot
bot_grok_3_mini_latest_high  /  run_bot
46s
bot_grok_3_mini_latest_high / run_bot
bot_uniform_probability  /  run_bot
50s
bot_uniform_probability / run_bot
Fit to window
Zoom out
Zoom in