Bij het analyseren van een test of de beoordeling, zijn de twee belangrijkste concepten betrouwbaarheid en validiteit. Deze twee concepten zijn vergelijkbaar met de concepten van precisie en nauwkeurigheid; een beschrijving van samenhang van de beoordeling, terwijl anderzijds het niveau van de waarheid van de beoordeling beschrijft. In deze zin is geldigheid de belangrijkste eigenschap van een test of de beoordeling, aangezien haar waarde geeft aan de legitimiteit van de test zelf. Maar dit concept niet zo eenvoudig is, en daarom er vele verschillende vormen van geldigheid zijn.
Predictieve validiteit
De predictieve validiteit van een assessment tool verwijst naar van dat gereedschap vermogen om te voorspellen van toekomstig gedrag of situaties op basis van de resultaten van het hulpprogramma. Bijvoorbeeld, hebben onderzoekers gevonden hoge predictieve validiteit voor IQ tests wanneer toegepast op toekomstige salaris. Kinderen met hoge IQ's zijn meer kans om hoge verdieners wanneer ze volwassenen. Test-makers die een beoordeling met de mogelijkheid ontwerpt om de situaties in de toekomst in gedachten vaak voorspellen nadruk hoofdzakelijk op het ontwerpen van een test met hoge predictieve validiteit.
Convergente validiteit
Convergente validiteit beschrijft een assessment tool de relatie tot vergelijkbare evaluaties. Als een beoordeling een hoge convergente validiteit heeft zal dan een individuele scoren hoog op die evaluatie waarschijnlijk vaak hoog scoren op evaluaties die een gelijkaardige eigenschap worden geëvalueerd. Bijvoorbeeld, ontworpen de psychologen Alfred Binet en John Raven apart tests van de IQ. Maar ook al hun proeven verschillend gestructureerd, beiden hebben hoge convergente validiteit. Dat wil zeggen, als u hoog op één van de tests scoren, zult u waarschijnlijk aan de andere hoog scoren. Evenzo, als u laag op een scoren, u zal waarschijnlijk laag scoren anderzijds.
Oppervlakte geldigheid
Oppervlakte geldigheid is misschien wel het makkelijkst te beoordelen. De naam beschrijving van detest verschijning. Een beoordeling met hoge oppervlakte validiteit bevat vragen die worden weergegeven voor het testen van de trek van belang. Bijvoorbeeld, in IQ testen, moeten tests met hoge oppervlakte validiteit bevatten vragen met betrekking tot logisch redeneren of verbale Behendigheid maar niet vragen met betrekking tot persoonlijke voorkeuren of politieke aanzien.
Externe validiteit
Externe validiteit is de moeilijkste vorm van geldigheid te analyseren. Het is het ware vermogen van een risicobeoordeling, om te meten wat het is bedoeld om te meten. In veel gevallen, kan externe validiteit slechts worden geraamd, niet echt berekend. Bijvoorbeeld, IQ tests willen meten van iemands vermogen om nieuwe problemen op te lossen, maar sommigen beweren dat tests van verbale Behendigheid en logisch redeneren niet gelijkwaardig zijn aan proeven van het vermogen nieuwe problemen op te lossen. Terwijl de meeste psychologen zijn het eens dat IQ tests hoge externe validiteit, is het vrijwel onmogelijk om dit als een feit. Een IQ-test hebben dus nooit perfect externe validiteit.