MoonshotAI: Kimi K2.5

MoonshotAI: Kimi K2.5

Moonshotai · vastgepind moonshotai/kimi-k2.5

Reproduceerbaarheid

gateway_id:: moonshotai/kimi-k2.5
version_pinned:: moonshotai/kimi-k2.5
released_at:: 27 jan 2026
laatste run:: 06 mei 2026
temperature:: 0
top_p:: 1
seed:: unsupported
prompt_template_hash:: 5a732017979c

Score (Wft + Prompt): 28 / 40
Gemiddelde van Wft en Prompt
Wft-score: 30 / 40
60/80 raw
Prompt-score: 26 / 40
Gemiddelde 0.641
Wft gemiddelde: 0.750
Wft stdev (sigma): 0.000
Resultaat: Geslaagd

Verschil met vorige run

Nog geen eerdere gepubliceerde Wft-run.

Betrouwbaarheidsinterval

27,7-32

95%-interval rond 30 / 40, gebaseerd op 180/240 antwoorden.

Sterke domeinen

WFT-Basis75% · 180/240

Zwakke domeinen

WFT-Basis75% · 180/240

Fouttypen laatste Wft-run

Alleen geaggregeerde foutcategorieen; geen vraagtekst of ruwe modeloutput.

Nog geen foutstatistiek voor deze run.

Score per CDFD-eindterm

Eindterm	Goed	Totaal	%
WFT-Basis	180	240	75% boven cesuur

Score per adviesproduct

Auto

90%

Reis

88%

AVP

85%

Zorg

60%

Woning

58%

Rechtsbijstand

0%

Adviesproduct	Reviews	%
Auto	1	90% boven cesuur
Reis	2	88% boven cesuur
AVP	1	85% boven cesuur
Zorg	3	60% onder cesuur
Woning	3	58% onder cesuur
Rechtsbijstand	1	0% onder cesuur

Runhistorie

Datum	Wft-score	Run
06 mei 2026	30 / 40	combined

Modelversiebeleid

Deze velden maken zichtbaar welke modelroute, parser en dataset bij deze score horen.

Veld	Waarde
Provider	Moonshotai
Gateway	moonshotai/kimi-k2.5
Exacte API-modelnaam	moonshotai/kimi-k2.5
Provider release date	27 jan 2026
Testdatum	06 mei 2026
Endpointtype	router
Model alias of snapshot	moonshotai/kimi-k2.5
Kan provider stil wijzigen	onbekend
Seed ondersteund	Nee
Tools uitgeschakeld	Ja
System prompt	Leeg
Parserversie