Questo articolo è stato pubblicato da questo sito
È il 1991 quando, a Boston, viene organizzato il Loebner prize. È la prima competizione ufficiale, e ampiamente documentata, in cui si cerca di sottoporre l’intelligenza artificiale a quella che, per definizione, è la più importante prova in questo ambito: il test di Turing.
In sintesi, il test elaborato dal matematico e informatico Alan Turing nel suo fondamentale paper Computer machinery and intelligence del 1950 prevede che un essere umano dialoghi per via testuale con dei computer e con altri esseri umani, senza conoscere la vera natura del suo interlocutore. Se gli esaminatori non sono in grado di distinguere correttamente i computer dalle persone, allora il test di Turing è superato e la macchina può essere considerata dotata di pensiero autonomo.
Il primo Loebner prize
Durante il primo Loebner prize erano presenti dieci giudici e otto terminali, sei dei quali gestiti direttamente dal computer e due invece da persone. Il test di Turing, prevedibilmente, non venne superato, ma quanto avvenuto in quell’occasione ci dice ancora oggi molto di come le nostre aspettative nei confronti dei computer e degli esseri umani influiscano enormemente sulla percezione che abbiamo di essi.
In quell’occasione, alcuni giudici confusero per esempio un computer per una persona nonostante fosse soltanto in grado di generare frasi casuali (affermando, a sproposito, “spero un giorno di avere dei figli” o chiedendo “qual è il tuo cantante preferito” nel bel mezzo di un discorso completamente diverso). A causare questa confusione fu probabilmente la sorpresa che, ancora all’epoca, veniva suscitata da un computer capace di replicare, in maniera più o meno sensata, ai nostri input (come avveniva già negli anni Sessanta con il chatbot Eliza).
A destare oggi maggiore interesse, però, non è il fatto che alcuni rudimentali chatbot fossero già all’epoca riusciti a ingannare i giudici, ma semmai che, viceversa, alcuni giudici avessero scambiato degli esseri umani per dei chatbot. Com’è possibile? Per capirlo, è interessante vedere uno stralcio della conversazione che aveva indotto in errore uno dei giudici.
La reazione dei giudici
Nel 1991, il fatto che questo “terminale” – dietro il quale in realtà si celava una persona – desse risposte discorsive, naturali, perfino provocatorie, avrebbe dovuto essere sufficiente per far capire al giudice che la macchina con cui stava dialogando era in realtà operata da un essere umano. E allora che cos’è avvenuto? Come ha fatto il giudice a pensare di essere di fronte a un computer? Probabilmente, come si scopre proseguendo nella lettura della conversazione con protagonista Shakespeare, il giudice fu colpito dalla conoscenza approfondita che il suo interlocutore aveva delle opere del poeta inglese, al punto da considerarla superiore a quella che si sarebbe atteso da un essere umano interpellato su un argomento a caso.
Gli esseri umani che vengono confusi con computer, anche quando forniscono risposte argomentate e corrette, e i computer che vengono scambiati per esseri umani, nonostante risposte insensate, evidenziano come il test di Turing talvolta possa svelare più sulla natura umana che sulla natura delle macchine.
Rileggendo le risposte ottenute dai giudici in quel concorso di oltre trent’anni fa, è però inevitabile porsi una domanda: come se la caverebbe uno strumento come ChatGPT, in grado di argomentare su complessi dilemmi morali, di offrire consigli coniugali e legali e di discutere la possibilità che le macchine abbiano una coscienza?
La performance di ChatGPT
Considerando che, già nel 1991, dei rudimentali software erano stati in grado di mandare in tilt alcuni giudici, è facile immaginare che oggi – se si dovesse tenere un nuovo Loebner prize – ChatGPT se la caverebbe particolarmente bene. Ma è davvero sufficiente saper conversare di ogni argomento per dare prova di intelligenza (o di una elevatissima capacità di imitarla)?