When was Claude Sonnet 4 released?

Claude Sonnet 4 was released by Anthropic on May 22 2025.

When was Muse Spark released?

Muse Spark was released by Meta on Apr 8 2026.

Which is better on GPQA Diamond, Claude Sonnet 4 or Muse Spark?

Muse Spark scores higher on GPQA Diamond — Claude Sonnet 4 75.4% vs Muse Spark 89.5%.

Which is better at coding, Claude Sonnet 4 or Muse Spark?

On SWE-Bench Verified (real-world software-engineering tasks), Muse Spark leads — Claude Sonnet 4 scores 72.7% and Muse Spark scores 77.4%.

Home Analytics Contact

Latest Release

Muse Spark

Apr 8 2026

Home/Compare/Claude Sonnet 4 vs Muse Spark

Claude Sonnet 4 vs Muse Spark

0 vs 3 benchmarks won

	Anthropic Claude Sonnet 4	Meta Muse Spark
Overview
Company	Anthropic	Meta
Release date	May 22 2025	Apr 8 2026
Model type	—	—
Open source	No	No
Specifications
Parameters	—	—
Context window	—	—
Benchmarks
Science reasoning GPQA Diamond	75.4%	89.5%
Software engineering SWE-Bench Verified	72.7%	77.4%
Multimodal understanding MMMU	—	80.4%
Timeline
Release gap	Claude Sonnet 4 shipped 321 days before Muse Spark

Which is better: Claude Sonnet 4 or Muse Spark?

Muse Spark leads Claude Sonnet 4 on 3 of the tracked benchmarks (GPQA Diamond, SWE-Bench Verified, MMMU). Claude Sonnet 4 shipped 321 days before Muse Spark, so benchmark comparisons should account for the intervening progress.

Published specifications for these two models are limited — see each model page for the latest details.

On GPQA Diamond, Muse Spark scores 89.5%, 14.1 points above Claude Sonnet 4 at 75.4%. On SWE-Bench Verified, Muse Spark scores 77.4%, 4.7 points above Claude Sonnet 4 at 72.7%.

Frequently asked questions

When was Claude Sonnet 4 released?: Claude Sonnet 4 was released by Anthropic on May 22 2025.
When was Muse Spark released?: Muse Spark was released by Meta on Apr 8 2026.
Which is better on GPQA Diamond, Claude Sonnet 4 or Muse Spark?: Muse Spark scores higher on GPQA Diamond — Claude Sonnet 4 75.4% vs Muse Spark 89.5%.
Which is better at coding, Claude Sonnet 4 or Muse Spark?: On SWE-Bench Verified (real-world software-engineering tasks), Muse Spark leads — Claude Sonnet 4 scores 72.7% and Muse Spark scores 77.4%.