FISICA/MENTE

 

LA VALUTAZIONE SCOLASTICA

Roberto Renzetti

1996

 

        La valutazione è sempre il momento successivo alla programmazione. Nella programmazione si identificano gli  obiettivi generali e specifici. In essa devono essere chiariti i metodi di lavoro e le forme di controllo scolastico.

        Gli obiettivi, oltre che informativi (contenuti), sono (o possono essere) di capacità e comportamenti. Comunque, prima di sapere come valutare si deve aver chiaro cosa valutare. Dobbiamo quindi chiarire gli obiettivi didattici definendo ciò che ci aspettiamo dal corso di studio. Dobbiamo essere noi per primi ad essere coscienti di che cosa vogliamo che lo studente sia in grado di fare alla fine del corso. Si tratta di rispondere all'esigenza di razionalizzare e porre su basi scientifiche l'istruzione.

 

Razionalizzare e cioè:

*specificare in dettaglio gli scopi della formazione, le risorse di cui si dispone ed i processi formativi che si vogliono impiegare;

*  scegliere tra i vari processi che si possono usare quelli che empiricamente sono risultati più efficienti;

 

Porre su basi scientifiche e cioè:  

* utilizzare metodi analitici ed il più possibile oggettivi per compiere la suddetta razionalizzazione;

* utilizzare i metodi della docimologia

 

        Sono quindi gli obiettivi l'argomento preliminare di un gruppo scuola ed un sottogruppo classe. Vediamo in un diagramma di flusso come si articolano tra loro tali obiettivi.

 

 

        Per misurare il conseguimento di un dato obiettivo è spesso necessario specificarlo ulteriormente in obiettivi parziali.

______________________________________________

        ESEMPIO

           Supponiamo di avere per obiettivo la "padronanza del linguaggio e capacità di comunicazione".

Tale obiettivo può essere parcellizzato nei seguenti:

_______________________________________________

        Fissati gli obiettivi, si devono delimitare i contenuti cercando quelli che sono più funzionali al raggiungimento degli obiettivi (che dovranno spesso essere graduati in obiettivi parziali).

        Definiti gli obiettivi in relazione ai contenuti (con l'ulteriore specificazione in obiettivi parziali) occorre:

        I risultati della verifica possono poi essere letti in vario modo:

        La lettura dei risultati fa scattare la valutazione. Si capisce quindi che la valutazione finale non può che essere uno dei momenti di valutazione del corso di studi. Essa deve essere fatta in rapporto alla programmazione e NON PUO' essere improvvisata, in qualche giorno, prima dell'esame stesso (mi rendo conto che quanto qui espresso sembra una eclatante sciocchezza se lo si confronta con come sono andate e vanno le cose in Italia almeno dal 1969).

       

DI QUALI MEZZI CI SI PUO' SERVIRE PER VALUTARE ? QUALI DI QUESTI MEZZI SONO PIU' CORRETTI ?

        Abbiamo a disposizione i mezzi asistematici ( o intuitivi), quelli generalmente usati che hanno scale di misurazione non comparabili (sono soggettivi, approssimativi, empirici). Riporto un solo esempio di esperienza personale.

        Nel 1971 presso il CEDE partecipai ad un corso di aggiornamento (prof. Titone) in cui 20 insegnanti di italiano correggevano lo stesso tema e lo spettro dei voti andava dal 2 al 9.  Successivamente 20 insegnanti di matematica correggevano lo stesso problema e lo spettro dei voti andava da 4 all' 8. Quanto qui detto non è un dato isolato. Ormai è certo che le cose stanno così. Evidentemente l'asistematicità può giocare veri e propri brutti scherzi nella valutazione.

        Abbiamo poi a disposizione i mezzi sistematici (o prove oggettive o prove strutturate). Si tratta di ridurre al minimo le considerazioni soggettive del singolo insegnante. Tali prove si distinguono in:

 

 

           *le precedenti ripetute in più anni e corrette successivamente anche con classi di controllo.

 

        Realisticamente è il caso di occuparsi delle prove non standardizzate (dando però una qualche indicazione per rendere standardizzabili).

 

 

COME SI PROCEDE

 

Le tecniche più correnti per queste prove sono:

VANTAGGI

SVANTAGGI

PER ELIMINARE GLI SVANTAGGI

Si deve tener in ogni caso conto che, in prospettiva, l'unica selezione la si potrà fare su prove oggettive.

 

MISURAZIONE ED ELABORAZIONE DEI DATI

        Vediamo ora come usare i dati che si ricavano da queste prove:

        Per fare tutto ciò occorre fissare dei criteri per l'attribuzione dei punteggi (da non confondersi con il voto):

 

RISPOSTA

 

             ESATTA

       ERRATA

           ASTENSIONE

 

 

 

 

 

Vero/falso; si/no

 

           + 1

- 1

0

Scelta multipla con 4 alternative

 

            + 3

- 1

0

Scelta multipla con 3 alternative

 

            + 2

- 1

0

Altri tipi di quesiti

 

            + 1

 0

0

Risposte a valutazioni differenziate

 

                           Punteggio da stabilirsi a priori

 

        Assegnati i punteggi, si passa all'elaborazione dei dati.

ESEMPIO SU UNA CLASSE DI 24 STUDENTI

        Si inizia a costruire una tabella con i punteggi che ciascuno studente ha avuto, la tabella delle frequenze (l'esemplificazione che segue è sperimentale).

Punteggio n° studenti

100

1

97

1

86

1

85

1

83

1

79

1

77

1

75

1

70

1

68

1

66

2

64

2

62

1

60

2

58

3

55

1

47

1

45

1

33

1

        Si raggruppano i punteggi in intervalli predeterminati e si vede quanti studenti sono dentro un dato intervallo (tabella degli intervalli di frequenza):

 

PUNTEGGIO N° STUDENTI

100-90

2

89-80

3

79-70

4

69-60

9

59-50

4

49-40

2

39-30

1

 

        A questo punto si costruisce un istogramma che riporterà la distribuzione dei punteggi degli studenti.

 

 

 

        Si definiscono poi:

  • gruppo modale --> l'intervallo in cui si addensa il maggior numero di studenti (nel nostro caso tra 60 e 70)

  • mediana            --> il punteggio dello studente centrale (nel nostro caso tra il 12° e 13° studente e quindi 65)

  • media                --> la somma dei punteggi diviso il numero degli studenti (nel nostro caso 1616/24=67,3)

        Il confronto tra queste tre grandezze ci fornisce indicazioni sulla difficoltà del test. Un test ideale deve vedere coincidere le tre grandezze. Nel nostro caso siamo con media e mediana che cadono nel gruppo modale. Il test così rappresentato è un buon strumento di valutazione e risulta di media difficoltà. E' quindi possibile dare alla media (il 67) il valore di sufficienza. Gli altri voti vengono dati per estrapolazione con criteri da esplicitare a priori [se si decide di assegnare punteggi da 1 a 10, chi ha 33 punti prende 1, chi ha 100 punti prende 10, gli altri punteggi vengono dati interpolando. Si deve però tenere conto che si possono costruire altre possibili scale di valutazione, ma tutte da definire a priori. Un esempio lo vedremo più oltre].

        Vediamo esempi di istogrammi che forniscono indicazioni diverse sulla difficoltà del test e sul valore del punteggio da associare alla sufficienza.

        Nel primo caso abbiamo la media che cade al di sopra del gruppo modale e ciò vuol dire che il test è difficile.

        Nel secondo caso la media cade al di sotto del gruppo modale e ciò vuol dire che il test è facile.

 

 

            In entrambi i casi non sarà più la media a rappresentare la sufficienza ma la mediana poiché essa, essendo relativa al punteggio centrale è più coerente con la distribuzione reale.

            La media al di fuori del gruppo modale ci informa di qualche anomalia nella classe. O studenti in grave ritardo (media in basso) o studenti con conoscenze molto superiori (media in alto). Naturalmente qui discende anche il feed-back di cui dicevo prima. E' possibile che il lavoro dell'insegnante non sia adeguato. E' possibile che il test fosse superiore alle capacità di quel gruppo, ma è anche possibile che fosse troppo facile. Queste considerazioni faranno intervenire l'insegnante con ulteriori spiegazioni e serviranno via via a calibrare il test medesimo.

            In ogni caso, negli esempi visti, la media perde valore mentre la mediana rappresenta meglio la classe.

            Un test è considerato di difficoltà adeguata se la media oscilla intorno al 60% del punteggio massimo che si può ottenere in un dato test.

            Riassumendo gli istogrammi ("arrangiati" a gaussiane) che ci raccontano, rispettivamente di test adeguati, difficili o facili sono quelli rappresentati dalle "curve" seguenti:

 

           

 

ALTRE INFORMAZIONI RICAVABILI DAGLI ISTOGRAMMI

 

          

Riporto due situazioni limite che possono presentarsi:

 

 

            La seconda situazione è la migliore: pochi studenti "scartano" in modo significativo dalla media. Il livello di apprendimento è omogeneo, fatto che non si verifica nella prima situazione.

            Per concludere occorre almeno accennare all' indice di dispersione (non è proprio il caso di introdurre la deviazione standard perché complessa e non particolarmente utile ai piccoli numeri di una classe. Immagino che con tale strumento il CEDE saprà analizzare, a livello nazionale,  i risultati delle "terze prove" degli esami finali", anche se viziati da una diversità non facilmente riconducibile ad un'unica analisi).

CALCOLO DELL'INDICE DI DISPERSIONE

  •             Dati i risultati di un test si inizia con una scrematura che prevede lo scarto dei punteggi estremi (max e min) e si trova la metà dell'intervallo di punteggi che vanno dal terzo al terzultimo studente (se essi sono in numero da 15 a 21) e dal quarto al quartultimo (se essi sono in numero tra 22 e 28). Nel nostro esempio ci sono 24 studenti: il punteggio del 4° è 85, quello del quartultimo è 55. L'indice di dispersione è la semidifferenza di questi due valori: 

 ID = (85 - 55)/2 = 15

  •             A questo punto si calcola il numero degli studenti che scarta dalla media di + o - 15 punti (nel nostro caso da 67,3 + 15 = 82,3 e 67,3 - 15 = = 52,3).
  •             Si calcola ora il numero degli studenti che scarta dalla media del doppio del valore precedente, cioè + o - 30 (nel nostro caso 67,3 + 30 = 97,3 e 67,3 - 30 = 37,3).

  •             Quanti scartano dalla media del triplo.............

  •             E così via finché il conto è possibile.

  •             Si fa quindi un istogramma che ha la media come asse centrale (cioè: 67,3) ed a destra e a sinistra i punteggi sopra calcolati. Nel nostro caso si ottiene che tra 67,3 e 52,3 vi sono 11 studenti; tra 67,3 e 82,3 vi sono 6 studenti; e così via.

 

           

            Perché il livello di apprendimento possa essere considerato buono per il gruppo classe occorre che il 68% degli studenti abbia un punteggio che cada tra l'indice di dispersione + 1 e l'indice di dispersione - 1 (nel nostro esempio tra 52,3 e 82,3. E ciò è verificato poiché 17/24 è circa uguale al 71%).

ESEMPI DI ISTOGRAMMI RELATIVI A DUE TEST

           

Anche per vedere cosa d'altro si può apprendere dall'uso di questi test riporto due esempi di istogrammi costruiti su due test. Qui vi è una novità: vi è anche un istogramma che riguarda alla data domanda quanti ragazzi hanno risposto (il terzo istogramma di ogni esempio).

 

           

 

            Dagli esempi mostrati l'insegnante  può capire la difficoltà di una determinata domanda (o è mal formulata o l'argomento non è stato trattato adeguatamente). Su questo aspetto si può intervenire in somministrazioni dello stesso test in anni successivi (standardizzabilità). Se alla domanda 3 nessuno risponde c'è qualcosa che non va. Se alla domanda 7 rispondono tutti, quella domanda è inutile.

ALTRI TESTS ED ALTRI CRITERI

  

         Fatte le verifiche disciplinari sui contenuti specifici, occorre passare ai tests che verifichino il conseguimento degli obiettivi generali di capacità e comportamenti. Questi tests non potranno che essere standardizzati. Tutte le discipline, infatti, concorrono alla soluzione di una questione non necessariamente disciplinare.

            Dal punto di vista della valutazione da associare ad un determinato punteggio è anche possibile decidere a priori una determinata scala. Dato il test si vede qual è il minimo voto possibile (ad esempio - 20) e quale il massimo voto possibile (ad esempio + 80). Si rapporta tutto questo ad una scala decimale o centesimale e, mediante semplici proporzioni si calcola immediatamente qual è il voto da assegnare ad ogni singolo studente.

            Una ultima considerazione riguarda la Terza Prova introdotta negli esami di Stato. Dovendo essere preparata dalla Commissione d'esame in poco tempo ed essendo slegata da qualunque programmazione che coinvolga gli operatori didattici nel loro insieme può solo essere una sommatoria di singoli pezzi di singole discipline. I criteri di razionalizzazione e scientificità tenderanno a svanire. Si sono creati abiti ricercati ma la tendenza è il lasciarli negli armadi.


Torna alla pagina principale