We publiceren onze nauwkeurigheidsgegevens omdat transparantie vertrouwen opbouwt. Elk getal hier komt van een onafhankelijke benchmark van 211 echte teksten.
Elke engine heeft verschillende sterke punten. Consensus combineert ze.
← Swipe to see all columns →
| Engine | Vals-positief percentage | Echt-positief percentage | Sterkte |
|---|---|---|---|
| GPTZero | 0,0% | 88,2% | Menselijke bewaker — laagste FPR |
| Winston AI | 3,5% | 90,2% | Gebalanceerde detector |
| Originality.ai | 18,4% | 94,1% | Agressief — hoogste TPR |
| OmniScore (Consensus) | 2,5% | 96,1% | Beste van beide: lage FPR + hoge TPR |
FPR = menselijke tekst onterecht gemarkeerd als AI (lager is beter). TPR = AI-tekst correct geïdentificeerd (hoger is beter).
Originality.ai alleen markeert 18,4% van menselijk schrijven als AI. Door consensus daalt dat tot 2,5%.
Originality.ai individueel FPR 18,4% → Consensus FPR 2,5%
Alle drie de engines zijn het eens over het oordeel (3/3)
Twee van drie engines zijn het eens, uitschieter genegeerd (2/3)
Alle engines zijn het oneens — gemarkeerd als onzeker
Wanneer engines het oneens zijn, is dat ook informatie. Een verdeeld oordeel vertelt je dat de tekst dubbelzinnig is — eerlijker dan een valse vertrouwensscore van een enkele detector.
Grondigheid erin, vertrouwen eruit.
Menselijke teksten uit 15+ bronnen: klassieke literatuur, academische papers, studentenessays, nieuwsartikelen, blogberichten, forumdiscussies en professioneel schrijven. AI-teksten van 6+ modellen: GPT-4o, Claude 3.5, Gemini, Llama, Mistral en meer.
Alle menselijke steekproeven zijn verzameld met pure extractietools (Firefox Reader Mode, Firecrawl). Geen LLM is gebruikt om menselijke tekst te 'reinigen' of 'extraheren' — omdat LLM-extractie AI-achtige artefacten produceert die benchmarkintegriteit aantasten.
10 steekproeven die aanvankelijk als 'menselijk' waren gelabeld, werden opnieuw geclassificeerd nadat alle drie de engines ze unaniem markeerden — herleid tot het gebruik van een LLM voor tekstextractie. Lessen geleerd, methodologie verbeterd, en deze steekproeven uitgesloten van scoring.
171 Engelse + 40 Duitse steekproeven. Beide talen getest tegen alle drie de engines om meertalige nauwkeurigheid te verifiëren.
Elke engine-upgrade, algoritmewijziging of drempelaanpassing triggert een volledige benchmark-hertest. De dataset groeit bij elke iteratie.
Which AI detector is the most accurate? Individual tools achieve 85-95% accuracy, but they frequently disagree — our benchmark shows engines contradict each other on 15-30% of texts. A single score cannot give you certainty.
OmniDetect solves this with multi-engine consensus. By combining GPTZero (the academic standard), Winston AI (content marketing focus), and Originality.ai (highest single-engine precision), we reduce false positives from ~18% to just 2.5% — verified across 1,038 independent samples.
| Tool | Engines | FPR | Approach |
|---|---|---|---|
| OmniDetect | 3 (consensus) | 2.5% | Multi-engine verdict |
| GPTZero | 1 | ~9% | Perplexity-based |
| Originality.ai | 1 | ~8% | Deep learning |
| Winston AI | 1 | ~12% | Transformer-based |
The methodology is simple: when three independent engines agree, the result is far more reliable than any single opinion. It's the difference between one judge and a jury.
Geen AI-detector is perfect. Dit is waar de onze moeite mee heeft.
Twee AI-steekproeven die studenten- en verhalende stijlen imiteerden, scoorden onder 16%. Winston AI en Originality.ai misten ze volledig — alleen GPTZero markeerde ze.
Alle drie de vals-positieven waren academische of professionele teksten. Formeel, gestructureerd schrijven kan lijken op AI-outputpatronen.
Teksten onder 300 woorden produceren minder stabiele resultaten bij alle engines. We raden 500+ woorden aan voor betrouwbare oordelen.
Zwaar geparafraseerde AI-tekst kan alle drie de engines omzeilen. Geen detector op de markt lost dit volledig op.
Niet-Engelstalige schrijvers produceren soms patronen die overlappen met AI-gegenereerde content, wat leidt tot hogere scores dan verwacht.
Cijfers zijn mooi. Ervaring is beter. Probeer een gratis scan en beoordeel de nauwkeurigheid zelf.
Gratis scan starten