Leaderboard wordt geladen
Moonshotai · vastgepind moonshotai/kimi-k2.5
Nog geen eerdere gepubliceerde Wft-run.
95%-interval rond 30 / 40, gebaseerd op 180/240 antwoorden.
Alleen geaggregeerde foutcategorieen; geen vraagtekst of ruwe modeloutput.
Nog geen foutstatistiek voor deze run.
| Eindterm | Goed | Totaal | % |
|---|---|---|---|
| WFT-Basis | 180 | 240 | 75% boven cesuur |
| Adviesproduct | Reviews | % |
|---|---|---|
| Auto | 1 | 90% boven cesuur |
| Reis | 2 | 88% boven cesuur |
| AVP | 1 | 85% boven cesuur |
| Zorg | 3 | 60% onder cesuur |
| Woning | 3 | 58% onder cesuur |
| Rechtsbijstand | 1 | 0% onder cesuur |
| Datum | Wft-score | Run |
|---|---|---|
| 06 mei 2026 | 30 / 40 | combined |
Deze velden maken zichtbaar welke modelroute, parser en dataset bij deze score horen.
| Veld | Waarde |
|---|---|
| Provider | Moonshotai |
| Gateway | moonshotai/kimi-k2.5 |
| Exacte API-modelnaam | moonshotai/kimi-k2.5 |
| Provider release date | 27 jan 2026 |
| Testdatum | 06 mei 2026 |
| Endpointtype | router |
| Model alias of snapshot | moonshotai/kimi-k2.5 |
| Kan provider stil wijzigen | onbekend |
| Seed ondersteund | Nee |
| Tools uitgeschakeld | Ja |
| System prompt | Leeg |
| Parserversie |
| answer-parser-v2 |
| prompt_template_hash | 5a732017979c |
|---|
| Benchmarkversie | WFT-Basis v1 |
|---|
| Datasetversie | InsureBench Wft-Basis v1.1 |
|---|