InsureBench — Wft-Basis AI-benchmark

InsureBench

Leaderboard: AI-modellen gesorteerd op Wft-Basis score (40-punts schaal)
#	Model	Aanbieder	Open source	Score (40)	Wft	Prompt	Prijs / M tokens	Resultaat	Laatst getest
1	Anthropic: Claude Opus 4.8 (Fast)	Anthropic	—	35 / 40 66/80 raw Groep A	33 / 40	36 / 40	€9,20 in / €46,00 uit	Geslaagd +7,8	01 jun 2026
2	Gemini 3.1 Pro Preview	Google	—	34 / 40 68/80 raw Groep B

Data & citeren

Download geaggregeerde run-data als CSV of JSON. Gebruik onderstaande BibTeX voor bronvermelding.

CSV JSON

@online{insurebench_wft_basis_1_1_0,
  title        = {InsureBench: Wft-Basis AI Benchmark},
  author       = {InsureBench},
  year         = {2026},
  version      = {1.1.0},
  url          = {https://www.insurebench.nl/nl/wft-basis},
  urldate      = {2026-04-23},
  note         = {Public leaderboard, 80 questions, 3 runs per model}
}

Welke AI-modellen beheersen Nederlandse Wft-Basis kennis?

Kernbevinding

Belangrijkste beperking

Nu onderbouwd

Nog niet onderbouwd

Later pas toetsbaar

Leaderboard

Release-uitleg

Wat deze ronde zegt

Wat veranderde sinds de vorige ronde

Plausibel verklaarbare uitschieters

Wat je nog niet mag concluderen

Snelle datapunten uit de huidige leaderboard

Data & citeren