Grok 4.20 Beta Reasoning

Grok 4.20 Beta Reasoning

xAI · vastgepind xai/grok-4.20-reasoning-beta

Reproduceerbaarheid

gateway_id:: xai/grok-4.20-reasoning-beta
version_pinned:: xai/grok-4.20-reasoning-beta
released_at:: —
laatste run:: 23 apr 2026
temperature:: 0
top_p:: 1
seed:: unsupported
prompt_template_hash:: 5a732017979c

Score (40-eq): 28 / 40
57/80 raw
Gemiddelde: 0.708
Stdev (sigma): 0.006
Resultaat: Geslaagd

Verschil met vorige run

Nog geen eerdere gepubliceerde Wft-run.

Betrouwbaarheidsinterval

25,9-30,5

95%-interval rond 28,3 / 40, gebaseerd op 170/240 antwoorden.

Sterke domeinen

WFT-Basis71% · 170/240

Zwakke domeinen

WFT-Basis71% · 170/240

Fouttypen laatste Wft-run

Alleen geaggregeerde foutcategorieen; geen vraagtekst of ruwe modeloutput.

Refusal rate: 0%
Parserfouten: 47,5%

Type	Aantal	Rate
Parserfouten	38	47,5%
Refusals	0	0%
Timeouts	38	47,5%
Retry releases	0	0%
Failed jobs	0	0%

Score per CDFD-eindterm

Eindterm	Goed	Totaal	%
WFT-Basis	170	240	71% boven cesuur

Runhistorie

Datum	Wft-score	Run
23 apr 2026	28 / 40	wft_only

Modelversiebeleid

Deze velden maken zichtbaar welke modelroute, parser en dataset bij deze score horen.

Veld	Waarde
Provider	xAI
Gateway	xai/grok-4.20-reasoning-beta
Exacte API-modelnaam	xai/grok-4.20-reasoning-beta
Provider release date	Onbekend
Testdatum	23 apr 2026
Endpointtype	router
Model alias of snapshot	xai/grok-4.20-reasoning-beta
Kan provider stil wijzigen	onbekend
Seed ondersteund	Nee
Tools uitgeschakeld	Ja
System prompt	Leeg