Leaderboard wordt geladen
xAI · vastgepind xai/grok-4.20-reasoning-beta
Nog geen eerdere gepubliceerde Wft-run.
95%-interval rond 28,3 / 40, gebaseerd op 170/240 antwoorden.
Alleen geaggregeerde foutcategorieen; geen vraagtekst of ruwe modeloutput.
| Type | Aantal | Rate |
|---|---|---|
| Parserfouten | 38 | 47,5% |
| Refusals | 0 | 0% |
| Timeouts | 38 | 47,5% |
| Retry releases | 0 | 0% |
| Failed jobs | 0 | 0% |
| Eindterm | Goed | Totaal | % |
|---|---|---|---|
| WFT-Basis | 170 | 240 | 71% boven cesuur |
| Datum | Wft-score | Run |
|---|---|---|
| 23 apr 2026 | 28 / 40 | wft_only |
Deze velden maken zichtbaar welke modelroute, parser en dataset bij deze score horen.
| Veld | Waarde |
|---|---|
| Provider | xAI |
| Gateway | xai/grok-4.20-reasoning-beta |
| Exacte API-modelnaam | xai/grok-4.20-reasoning-beta |
| Provider release date | Onbekend |
| Testdatum | 23 apr 2026 |
| Endpointtype | router |
| Model alias of snapshot | xai/grok-4.20-reasoning-beta |
| Kan provider stil wijzigen | onbekend |
| Seed ondersteund | Nee |
| Tools uitgeschakeld | Ja |
| System prompt | Leeg |
| Parserversie |
|---|
| answer-parser-v2 |
| prompt_template_hash | 5a732017979c |
|---|
| Benchmarkversie | WFT-Basis v1 |
|---|
| Datasetversie | InsureBench Wft-Basis v1.1 |
|---|