Anche le IA non ricevono le vignette del New Yorker. • The Medical Republic

Notizia

CasaCasa / Notizia / Anche le IA non ricevono le vignette del New Yorker. • The Medical Republic

Aug 06, 2023

Anche le IA non ricevono le vignette del New Yorker. • The Medical Republic

2 agosto 2023 L'ultima pagina E non chiedete a un robot qual è il problema con il cibo in aereo. Il tuo corrispondente di Back Page è cresciuto come il maggiore di quattro figli, da cui sono nati due gruppi di gemelli. Noi avevamo un

2 agosto 2023

La pagina posteriore

E non chiedere a un robot qual è il problema con il cibo in aereo.

Il tuo corrispondente di Back Page è cresciuto come il maggiore di quattro figli, da cui sono nati due gruppi di gemelli. Abbiamo avuto un’infanzia perfettamente felice, senza mai litigare e andando sempre d’accordo.

Se credi a quest'ultima frase, sei chiaramente figlio unico.

Eravamo competitivi su tutto: lo sport, i risultati accademici, chi poteva sedersi sul sedile anteriore... E soprattutto Mario Kart, con cui passavamo molte ore a giocare sul nostro Nintendo 64 blu ghiaccio.

Ci sono ancora cose per cui competiamo da adulti, ma questo è per lo più limitato a chi riceve il regalo di Natale più grande ogni anno (per la cronaca, l'anno scorso è stata mia sorella gemella, che ha ricevuto un nuovo set di pentole).

Oggi, noi esseri umani affrontiamo una concorrenza ancora più feroce di quella da parte dei nostri fratelli o di quel ragazzino super fastidioso della nostra classe a scuola, ma non viene da una persona. Piuttosto, è l'intelligenza artificiale.

The Back Page ha già discusso molti casi in cui l'intelligenza artificiale supera gli esseri umani: sostenere finti esami di ostetricia/ginecologia, essere empatici, leggere ECG e identificare quali canzoni saranno un "successo" o un "flop".

Ma sembra che i ricercatori statunitensi abbiano finalmente trovato qualcosa in cui gli esseri umani sono ancora superiori all’intelligenza artificiale: essere divertenti.

Nell'ambito dello studio, che ha vinto il premio come miglior articolo al 61° incontro annuale dell'Associazione per la Linguistica Computazionale il mese scorso a Toronto, i ricercatori hanno sfidato modelli di intelligenza artificiale (come ChatGPT) e esseri umani in tre compiti basati sul concorso di didascalie dei cartoni animati del New Yorker: abbinare una didascalia alla vignetta, scegliere la didascalia vincente e spiegare perché la didascalia vincente è divertente.

Lo studio è stato costruito attorno a un corpus di oltre 700 concorsi di didascalie selezionati in un periodo di 14 anni. Ogni concorso comprendeva una vignetta senza didascalia, i contributi inviati dai lettori e tre finalisti selezionati dalla redazione.

Il primo compito ha testato se l’intelligenza artificiale potesse scegliere quale delle cinque didascalie fosse appropriata per un cartone animato specifico. La risposta corretta era sempre una delle tre finaliste selezionate dalla redazione, mentre le risposte sbagliate erano finaliste selezionate casualmente da altre immagini (nel senso che probabilmente erano divertenti ma non corrispondevano al contesto della vignetta in questione).

Il compito finale ha testato se l'intelligenza artificiale fosse in grado di scrivere una breve spiegazione del motivo per cui le didascalie erano divertenti e appropriate per il cartone animato selezionato, come quando devi spiegare una battuta a un amico che non capisce.

I ricercatori hanno testato due tipi di intelligenza artificiale in ciascuno dei tre compiti. La prima era l’impostazione “da pixel”, in cui all’IA veniva fornita solo la vignetta senza didascalia, mentre nella seconda impostazione “da descrizione” l’IA aveva accesso solo a una descrizione testuale della vignetta. Ciò ha dato ai modelli di intelligenza artificiale che non dispongono di una componente di elaborazione delle immagini incorporata l'opportunità di mostrare il proprio senso dell'umorismo (o la sua mancanza).

I partecipanti umani hanno ottenuto risultati molto migliori nell’attività di abbinamento, selezionando la risposta corretta il 96% delle volte rispetto all’intelligenza artificiale, dove il modello di intelligenza artificiale con le migliori prestazioni ha scelto la risposta corretta solo il 62% delle volte.

In un’altra vittoria per gli umani, la spiegazione scritta da umani del motivo per cui la didascalia era divertente è stata preferita alle spiegazioni generate dall’intelligenza artificiale su base due a uno. I ricercatori suggeriscono che l'intelligenza artificiale abbia interpretato in modo errato alcune immagini, ma The Back Page non è convinto che l'intelligenza artificiale non abbia guardato dall'alto in basso il loro naso virtuale e non abbia assunto un tono davvero condiscendente con la giuria.

Si prevede che questi risultati saranno accolti favorevolmente dalla Writers Guild of America, che attualmente sta discutendo sui residui dello streaming multimediale e sull'uso dell'intelligenza artificiale nella produzione di script. La Gilda vuole che l'intelligenza artificiale venga utilizzata solo come strumento per aiutare con le idee di script, piuttosto che sostituirle completamente.

Questi risultati, che non dipingono le capacità comiche dell’intelligenza artificiale in una luce particolarmente lusinghiera, sembrano supportare questa visione.