La voce come transito in un post-umano molto, ma molto umano

Riflessioni sulla profonda connaturalità “high-tech” del nostro medium vocale al tempo degli avatar parlanti

Al termine della traduzione di un’opera si rimane immancabilmente contaminati dal tema affrontato e ciò è ancora più vero quando il lavoro ha riguardato la voce umana, ovvero il nostro medium ancestrale.

L’uscita in Italia del libro di Steven Connor, La voce come medium. Storia culturale del ventriloquio, funziona allora come un irresistibile invito a iniziare una serie di riflessioni, stimolati da un’opera che si rivela unica per comprendere la voce come processo e prodotto di un corpo che vive in stretta interazione con i suoi ambienti culturali e sociali, dando corso a un fenomeno sonoro al contempo fisico e immateriale, capace di mediare la sfera interiore ed esteriore della propria realtà, prestandosi con la sua natura transitiva a veicolare altre dimensioni di vita.

Solo per ricapitolare, è il ventriloquio il filo rosso di cui Connor si serve per affrontare una caratteristica così peculiare per l’essere umano. Contemplando della voce tanto la naturalità quanto i fenomeni dissociativi – si parte dagli oracoli greci per giungere alla nostra attuale condizione di uomini che vivono tra/in sistemi meccanici ed elettronici ricchi di voci disincarnate – l’opera può dispiegarci la serie di forme e dinamiche di mediazione che, alimentate e filtrate dai vari sistemi socioculturali, rendono la voce quello strumento di espressione a cui abbiamo sempre riservato sia un’accoglienza attenta e venerata che un’impressione obbligata e distratta.

Richiamando implicitamente alcuni aspetti di questo fecondo lavoro, forti delle sue innumerevoli e sofisticate osservazioni, cercheremo di sviluppare delle ulteriori riflessioni. L’argomento che vorremmo affrontare è la sfida che i nuovi media portano in termini di vissuto esperieziale  e permeabilità di realtà diverse, mettendo in relazione la forma vocale, nostra prima potente protesi di intermediazione, con la sua attuale applicazione per nuovi generi di transito.

Nel percorso ci aiuteremo con alcuni recenti lavori che, pur partendo da sponde diverse, sembrano convergere significativamente nell’analisi. Nella prima parte prenderemo in considerazione caratteristiche maggiormente funzionalistiche, mentre nella seconda affronteremo l’argomento da un’angolatura più strutturalmente simbolica.

Una premessa vale la pena di fare. Nell’ambito delle nostre attuali attività può capitarci, sempre più spesso, di essere vittime di quel tipo di esperienza che Sherry Turkle paragona all’insieme di reazioni provate quando si viene sottoposti al test di Rorschach. La psicologa sociale americana, una pioniera nello studio delle nuove tecnologie dell’informazione e della comunicazione (ICT), afferma che, nell’interfacciare i nuovi strumenti e i nuovi mondi virtuali, siamo nella stessa condizione di una persona a cui si chieda di commentare le strane ed enigmatiche immagini di questo comune test.

In un’ottica simile, le nuove tecnologie dell’informazione e della comunicazione, costringendoci ad un continuo esercizio di rielaborazione, provano a riconsegnarci un altro senso delle cose, a sfidare le nostre categorie riproponendoci i fenomeni da un punto di vista diverso, spingendoci a riflettere sul modo di vivere, parlare e sentire.

Di fronte al proliferare delle interfacce virtuali, e specificamente vocali, sta avvenendo proprio questo e il lavoro di Connor è, per certi versi, una formidabile propedeutica a un tale genere di riflessioni che, nelle sue propaggini più filosofiche, tocca lo stesso senso della vita in un periodo della nostra storia così pieno di ibridazioni corporee, sociali e culturali.

L’uomo macchina da comunicazione
In un lavoro dedicato al tema della videocomunicazione mobile evidenziavamo come l’antica capacità e garanzia identificativa della voce umana, combinate con le potenzialità della tecnologia wireless, avviino una doppia trasformazione: mentre l’uomo, integrandola nel proprio corpo, tende a diventare un cyborg, il mondo degli oggetti, acquisendo questo fluido vitale, invece si anima. È per l’insieme delle sue qualità che la voce si sta così dimostrando il luogo naturale di accoglienza, assorbimento e transito delle due tendenze.

In quello stesso lavoro, sviluppando una sintetica ma profonda riflessione che ha il merito di legare passato e presente nel tentativo di spiegare il rapporto tra la voce e i media moderni, John Durham Peters individua per grandi linee come nel tempo la nostra esperienza/conoscenza del fenomeno vocale si è articolata, spiegandone la centralità in termini di potere, arte, medium di comunicazione ed eros, per indagare infine il carattere rivoluzionario del registro acustico nella modernità. Lo scritto trova anche il modo di lamentarsi della scarsa “cross-fertilization” tra i diversi settori di studio, un limite per una piena comprensione del fenomeno che vogliamo, sotto forma di richiamo, raccogliere unendo nello stesso alveo vari tipi di indagini.

Una risposta positiva all’esigenza proviene senza dubbio dall’ultimo lavoro di due scienziati del Massachusetts institute of technology (Mit), Clifford Nass e Scott Brave, Wired for Speech. How Voice Activates and Advances the Human-Computer Relationship.

I due studiosi, reduci da un periodo decennale di ricerche effettuate all’interno dei famosi laboratori, assegnano un enorme valore alle indagini che affrontano il tema da un punto di vista più strettamente sociale e culturale, indicandolo addirittura come il più produttivo.

Nel loro libro essi spiegano come l’evoluzione umana abbia risolto molti dei complessi problemi della comunicazione vocale, ottenendo infine un essere che è perfettamente «programmato per parlare». Di fronte alla nascita di macchine che si appropriano dei processi creativi e fattuali della parola, i due studiosi hanno il  problema di comprendere, a livello pratico, la migliore strategia di integrazione delle macchine parlanti negli ambienti e nelle relazioni umane.

Il loro assunto è che la voce ha la capacità diretta di inserire le macchine parlanti in un ambito di relazione sociale perché il cervello umano è conformato per rispondere al suo stimolo empaticamente. In presenza di una voce si supera la consapevolezza che a parlare siano degli artefatti e il cervello “automaticamente” si impegna a ricercare nel segno vocale gli indizi sociali e culturali utili a predisporci alla relazione.

In pratica, come ci spiega Steven Connor seguendo altre traiettorie che vediamo convergenti, per noi la voce implica una “presenza” umana. È vero che spesso – dati i limiti esistenti in termini di spazio, di memorizzazione, lentezza di elaborazione, larghezza di banda, dinamismo del contesto – la maggior parte delle interfacce vocali, non riproducendo parole pre-registrate ma sintetizzate, conosciute come “text to speech” (TTS), presenta una qualità vocale che fa trasparire una sensazione di artificialità.

Tuttavia, ciò non sembra fermare questo riflesso umano cosicché nella voce si vanno comunque a cercare tutti quegli indizi che normalmente aprono e guidano la relazione tra esseri sociali. Volendo precisare ulteriormente, non solo stabiliamo una naturale simpatia ma, non potendo rimanere in una posizione d’insopportabile ambiguità, l’oggetto animato dalla voce diventa una persona a cui assegniamo persino un’identità sessuale ben definita. Come si è arrivati a ciò?

Gli esseri umani sono caratterizzati biologicamente per processare e comprendere la voce. La prova più evidente è che anche persone con bassi punteggi di intelligenza (IQ =50) o con cervelli di dimensione ridotta (400 g, un terzo della normale grandezza) riescono comunque a parlare.

La voce è la forma di relazione primaria in tutte le culture e la specie umana è l’unica ad essere peculiarmente conformata per tale compito; ad esempio, la parte sinistra del cervello (orecchio destro) è più avvantaggiata nel comprendere il linguaggio natio (ma anche straniero) così come le sillabe che suonano “strane”, mentre l’orecchio sinistro lo è per tutti gli altri suoni, una caratteristica questa che si rispecchia anche a livello biologico, con le cellule dell’orecchio destro diverse nella loro capacità di amplificare maggiormente i suoni vocali.

Tale specializzazione appare presto nell’essere umano, fin dal primo giorno di vita, mentre fin dal quarto giorno è possibile notare una migliore reazione alla voce che parla nel linguaggio natio rispetto a quella che si esprime in altre lingue.

L’abilità della mente a percepire ed elaborare i segnali vocali è utilizzata primariamente per fini sociali. Il risultato dell’evoluzione ha portato gli esseri umani a diventare degli esperti automatici nell’estrarre gli indizi sociali dalle parole. All’interno dei gruppi umani saper individuare ciò che ha valenza sociale è stato un fattore evolutivo tra i più decisivi. In circa 200.000 anni, la società umana e i processi di produzione e di ascolto della voce si sono coevoluti in un sistema incredibilmente interconnesso, efficace e stabile, che ha trasformato gli esseri umani in creature «voice activated».

In particolare, è il genere sessuale a saturare il significato della voce. È questa una caratteristica che impegna grandemente il processo di riconoscimento vocale, al fine di categorizzare le persone tra maschi e femmine esaminando il tono della voce, la cadenza e altri fattori, in maniera da potersi relazionare appropriatamente. Il genere, così come la forma espressiva, influenza anche l’articolazione del contenuto che si vuole esprimere.

Ovviamente, vi sono anche altre caratteristiche, quali la velocità e il volume del parlare a evidenziare i tratti della personalità, le emozioni o le origini. Ad esempio, gli individui estroversi, eccitati o provenienti da alcune particolari regioni parlano più rapidamente e rumorosamente rispetto alla media delle persone. In effetti, non solo le voci identificano immediatamente gli individui ma già un feto reagisce a quella della madre, così come a una voce familiare, differentemente, e ciò si registra dall’aumento del  battito cardiaco. Un neonato, peraltro, è in grado di sintonizzarsi su una particolare voce, anche se ascoltata in mezzo ad altre, già ad otto mesi.

Per ottenere tali risultati non seguiamo un’educazione formale anche se ogni società fornisce regole sul modo di categorizzare voci e parole per indirizzare le attitudini, i pensieri e i comportamenti. Attraverso di esse, se sviluppate e selezionate, si fornisce una guida sistematica per determinare le azioni relativamente al genere, alla personalità, alle emozioni e persino alle questioni che hanno a che fare con la fiducia – recentemente mi hanno spiegato che nell’ambito dei call center vengono sfruttati tutti gli espedienti che migliorano la relazione con la clientela, cosicché un’azienda inglese che fornisce un servizio di assistenza finanziaria ha selezionato operatori che hanno un netto accento scozzese perché ciò risultava più rassicurante.

I due ricercatori americani, Nass e Brave, hanno fatto tesoro di tutti questi meccanismi e indicazioni funzionali per migliorare “tecnicamente” il grado di interazione in un mondo in cui proliferano apparecchiature e piattaforme elettroniche che si propongono direttamente come nostri interlocutori o che vorrebbero aggiungere la voce come ennesimo attributo interattivo, vedi in ultimo gli avatar di Second Life.

In un certo senso, la strategia di questi scienziati è chiara e per noi illuminante: se l’abilità di produzione e ascolto della parola vocale si sta trasferendo anche in altre macchine, allora il problema è di “esternalizzare” pienamente, stando attenti soprattutto agli aspetti sociali e culturali, le sofisticazioni incorporate e interiorizzate nell’essere umano, cercando di approssimare esternamente ciò che per noi è ormai un insieme “macchinico” autonomo. In sintesi, oggettivare negli artefatti quelle funzioni che già vanno di per sé, reincorporando nell’operazione la coscienza delle molte soglie che abbiamo già attraversato.

La valenza simbolica del linguaggio
Nella modernità, per rimanere nell’ambito del regime acustico, questo è accaduto già molte volte, in particolare con il telefono e il fonografo, come illustrato da un punto di vista fenomenologico da Steven Connor.

Tuttavia, richiamare gli aspetti evolutivi del rapporto organismo-voce, inquadrandoli solo funzionalmente, ci limiterebbe a vedere una faccia della medaglia, nascondendone una parte importante, che include la complessità in cui il fenomeno vocale vive. Terminiamo allora interrogandoci sul quel registro più propriamente simbolico che ci fa tralasciare il piano strettamente evolutivo per apririci alla misteriosità, fragilità e univocità dell’esperienza umana e sociale, alla nostra propensione all’Altro.

Steven Connor insiste molto sugli aspetti maggiormente profondi, ambigui e meno lineari dell’espressività vocale, richiamando spesso il filone psicoanalitico, in special modo quello lacaniano. La psicanalisi, infatti, ha dovuto approfondire la specificità simbolica per spiegare le nevrosi e le psicosi che attanagliano l’essere umano fin dall’inizio della vita, oltre ogni cosiddetto stadio della continua maturità. In un attuale lavoro, Il corpo e il linguaggio nella psicoanalisi, lo psicoanalista Alfredo Zenoni fornisce in maniera estremamente chiara alcune interessanti chiavi di lettura per spiegare l’origine dell’impulso simbolico. Le sue analisi tornano utili per capire cosa rende la voce un motore proiettivo di relazionalità alla perenne ricerca dell’Altro che manca.

Zenoni definisce «l’essere parlante» come più precisamente un «essere nel linguaggio», una creatura «precablata» dal linguaggio, che non si realizza a partire da una certa età in un processo che aggiunge funzioni ad altre funzioni elementari, ma un essere che vive fin dall’inizio in uno stato di «identificazione primordiale» che impregna, altera e snatura quella supposta condizione di animalità da cui partirebbe l’infanzia e, più in generale, l’umanità. In un certo senso è come se la dimensione strutturale che definisce l’umanità nelle sue realizzazioni culturali «si impadronisse anche di quell’organismo vivente definito umano facendone un corpo affetto da un desiderio del tutto estraneo dall’esperienza animale».

Per spiegare l’azione transevolutiva della dimensione simbolica sull’essere umano si deve distinguere il linguaggio come “struttura” dal linguaggio come “funzione”. Prima di essere una funzione di contenuti mentali individuali, il linguaggio determina sia una nuova realtà che una nuova corporeità rispetto all’esperienza animale, iscrivendo ogni individuo della specie all’interno di una dimensione che gli permette di essere «nominato, di essere reso singolare, di occupare un posto nella successione delle generazioni, di essere desiderato, indipendentemente dalle sue capacità mentali» anche prima che queste si sviluppino.

Un organismo che viene al mondo con il linguaggio dalla sua stessa parte si ritrova subito inserito in un processo dialettico che non gli proviene dalla sua base animale, ma proprio dal fatto di averla dimenticata. Quest’immersione non comprende soltanto l’intera attrezzatura della cultura ma anche la generazione che lo precede, facendo di lui qualcosa di diverso da un organismo bisognoso di cure,  «un polo d’identificazione e di attributi, inizialmente determinato come una ‘x’, un significato incognito nel punto di confluenza dei desideri che l’hanno messo al mondo».

L’essere parlante si trova così a ricevere, unico tra le diverse specie, «un’effettualità fatta di discorso, generato come chi è “parlato” ancora prima di essere parlante». Dall’immersione nel linguaggio, la condizione in cui si trova fin dalla nascita, l’essere umano riceve le basi del suo comportamento, e ciò che egli produce, ovvero la cultura, diviene a sua volta componente essenziale della sua strutturazione. Nel complesso dei caratteri morfologici e funzionali, che nascono dal processo di interazione del suo organismo con l’ambiente, vi è l’effetto di una caratteristica simbolica, culturale ed etnica, non solo a livello di attività più “nobili” ma anche di operazioni corporee supposte più elementari come l’alimentazione e la sessualità.

La retroazione del piano simbolico non implica affatto che «biochimica, organizzazione cellulare o fisiologia umana debbono essere eliminate» ma che è la loro «pertinenza» nello spiegare un comportamento a divenire critica con il venir meno dell’equivalenza con il mondo animale.

Il cucciolo umano è un piccolo essere di linguaggio che stabilisce da subito una relazione che «nell’elemento del simbolo assume la funzione di significare il desiderio dell’Altro». Poiché è già immerso nella dimensione della parola, il neonato è risposta vivente a ciò che «nell’Altro è segno della mancanza che lo abita, e in modo particolare risposta alla discontinuità della sua presenza». A condizione che l’Altro “risponda” invece di limitarsi a portare cose, il grido e i suoi pianti saranno già “appello” e “domanda”. Allo stesso tempo, ciò che soddisfa i bisogni elementari perde la semplice funzione vitale per trasformarsi in «doni, segni dell’amore dell’Altro: segni del dono del suo desiderio, del dono di quello che non ha».

Rappresentando altro da quel che sono da un punto di vista biologico, il piccolo potrà perfino rifiutarle nel caso l’Altro non inserisca nelle cure offerte la risposta della sua stessa mancanza. È come se il soggetto, per quanto infante «domandasse in primo luogo amore» e aprisse alla possibilità di poter essere privato di qualcosa di reale in favore di questo vuoto del desiderio: un fenomeno, afferma Zenoni, «semplicemente inconcepibile al di fuori del registro simbolico».

Riflessioni conclusive
L’atroce esperimento di Federico II (XIII secolo), che ambiva di sapere quale tipo di linguaggio sarebbe uscito dalla bocca di un neonato che venisse nutrito con cura ma astenendosi da qualunque contatto vocale, e che terminò con la morte di tutti i bambini, ne è la prova. È la cosiddetta “sindrome da ospedalizzazione”, che dimostra una sofisticata reazione, nonostante il livello certamente sottosviluppato delle loro funzioni cognitive e verbali, alla presenza «dell’Altro come Altro della parola e del desiderio dietro l’individuo che assicura il soddisfacimento dei bisogni».

La funzione nutrimentale infatti deve essere assicurata non solo in termini di sviluppo ma anche come «risposta a un appello». Per l’essere parlante è la dimensione dell’Altro a essere reale sin dalla sua strutturale presa nel campo della risposta e della domanda, e dunque sin dalla sua appartenenza alla specie umana. In definitiva, per la specie umana è l’aspetto sociale e culturale a rappresentare la sua caratteristica “biologica” fondamentale.

Anche sullo stesso piano biologico il corpo implica delle caratteristiche tali da tradurre gli effetti di questa presa in una dimensione Altra. Confrontato a un organismo animale il corpo è affetto da una minore vitalità, una connivenza meno accentuata con l’ambiente naturale, la stessa distanza dall’animalità che sembra manifestare il comportamento dell’animale “addomesticato” rispetto a quello selvaggio. È questo “meno” che ha potuto rendere definibile l’essere umano come un essere biologicamente “prematuro”. Il disadattamento e la sprovvedutezza, di fronte alle necessità della sopravvivenza, lo hanno in ultimo obbligato a secernere dal suo corpo gli utensili che gli avrebbero consentito di cacciare così come coltivare la terra. Una condizione, questa, della sua costituzione simbolica, ovvero condizione della ricerca di un «essere che ormai egli può ricevere solo dall’Altro».

 

Riferimenti

Connor, S., 2007, La voce come medium. Storia culturale del ventriloquio, Roma, Sossella.

Nass, C., Brave, S., 2006, Wired for Speech. How Voice Activates and Advances the Human-Computer Relationship, Chicago, Mit Press.

Zenoni, S, 1999, Il corpo e il linguaggio nella psicoanalisi, Milano, Bruno Mondadori.

www.bottegascriptamanent.it, anno II, n. 5, gennaio 2008