Parlare di Voce
Come il modo in cui parliamo della voce, influenza il nostro modo di usarla
Parliamo di voce da troppi anni.
Da così tanti anni che è imbarazzante sommarli: in totale abbiamo alle spalle 63 anni di esperienza collettiva (puoi giocare a “quanti-anni-chi” se vuoi).
In tutti questi anni abbiamo formato e consolidato linguaggi oserei dire personali per parlare di voce, e continuiamo a farlo aggiungendo tasselli, libri, curiosità e quella deliziosa qualità che è il sapere di non sapere, che ci porta a spendere molto più di quanto guadagniamo per continuare a farlo.
Che poi, parlare di voce è di per sé è lo scontro tra una metafora e un ossimoro (Francy? che mi dici?) perché presuppone una coerenza incredibile nel gesto ma, nei fatti, è spesso un salto nel vuoto.
Quando parliamo di voce, infatti, diamo suono a pensieri, emozioni, stati psico-fisici, bisogni, intenzioni, traumi somatizzati, fragilità scoperte, alla capacità di ascoltare e tutta una serie di componenti che si riverberano nel nostro fonare.
Parlare di voce diventa dunque dar suono a ciò che ci vive dentro, nel bene o nel male.
Ecco perché farlo non può essere scontato o banale, poiché ciò equivarrebbe a parlare di noi, come creature viventi, in maniera scontata e banale.
E purtroppo, a noi, piace nuotare in profondità.
Parla come leggi
Più o meno ci siamo: quando parliamo usiamo un range molto simile a quello usato in lettura, ma le frequenze usate sono molto più corpose e variegate.
Immaginaci come pavoni: quando leggiamo siamo normali, quando parliamo siamo sempre pavoni ma facciamo la ruota.
Ne evince che il modo in cui usiamo la voce vive di una diversa modulazione in fase di lettura, sia per meccanismi proiettivi che per meccanismi emotivi, che ci pongono in voce in maniera diversa da quando parliamo spontaneamente o quando leggiamo.
Questo cosa ci racconta?
Primo, che siamo tutti molto più musicali di quanto pensiamo, anche quando pensiamo di non esserlo;
secondo, che abbiamo a disposizione una gamma di suoni molto più ampia di quello che crediamo e, con un lavoro efficace sulla voce, siamo in grado di portarli nella nostra lettura in maniera naturale;
e terzo, che la fluidità sonora non è data dall’impostazione vocale, quanto più dal lasciare andare la voce, concetto di difficile assimilazione se non esperito.
Quando parliamo di formarsi alla voce per liberare la voce, intendiamo proprio questo: che non è possibile pensare di porsi in un percorso vocale con l’idea di "governare” la voce; ci è molto più utile parlare di esplorazione e conoscenza, due meccanismi liberatori e non costrittivi.
Quando parliamo di lavoro su sé stessi attraverso la voce, parliamo anche di questo: conoscersi, accettarsi e accettare il modo in cui la voce suonerà libera se avremo il coraggio di fidarci di lei.
Lee Y, Kreiman J. Acoustic voice variation in spontaneous speech. J Acoust Soc Am. 2022 May;151(5):3462. doi: 10.1121/10.0011471. PMID: 35649890; PMCID: PMC9135459.
Outing (a voce alta)
di Francesco Nardi (maggio 2023)
Prima di scrivere questo articolo comincio dall’individuazione dell’argomento che abbiamo scelto di trattare. Anche questa volta la proposta vincente è stata quella di Valentina: “Perché non parliamo di come il linguaggio, e ancora di più del modo in cui lo usiamo, influenza il nostro uso e la consapevolezza del nostro strumento voce?”.
Una bella domanda che, ancor prima di riflessioni sul tema, mi spinge a mettermi in gioco in prima persona. Farò un outing. Un outing a voce alta. Sì, lo confesso: capita spesso che nel mio quotidiano io NON usi la mia voce autentica.
Mi ha incastrato un medico, una foniatra per la precisione. I fatti erano lì, inequivocabili, di fronte al monitor da cui si poteva vedere il video girato poco prima all’interno della mia laringe mentre lei mi chiedeva ora di parlare normalmente, ora di accennare a cantare, ora di sussurrare e così via…
Non ricordo le parole precise, ma avendone ben fissati i contenuti, il dialogo tra noi due potrebbe essere andato più o meno così (ve ne riporto solo una sintesi!):
“Vede, Sig. Nardi? Qui, come si muovono le sue corde vocali… E ora qui come modificano il loro movimento quando le chiedevo di parlare velocemente?”
“Affascinante… Ma quelle sono davvero le mie corde vocali?!”
“Sig. Nardi, ecco l’ha fatto di nuovo… Quando si esalta lei fa impennare la frequenza della sua fonazione con la conseguenza di salire verso un registro più acuto producendo di conseguenza una voce che semplicemente non è la sua… O meglio: non è la sua voce naturale. Guardi ora qui… Guardi il monitor e soprattutto ascolti…”
“Mi sembra una voce più piena. Sì, decisamente più… corposa, mi vien da dire”
“Oh, bravo… Vede che se ci fa caso lei torna a casa?”
“In che senso…?”
“Nel senso che questa è la sua casa… La casa dove abita la sua voce”
“…”
“Lei ha una voce baritonale che corrisponde a un registro grave, profondo. Lei non è un medico e quindi non ha gli strumenti per comprendere appieno quello che le sto per mostrare… Ma torniamo lo stesso indietro un momento con le immagini. Qui, quando le chiedo di parlare lentamente e soprattutto in maniera più rilassata possibile…”.
Era vero: non avevo gli strumenti per apprezzare come si stava muovendo tutta quella serie di piccoli muscoli, cartilagini e mucose, ma osservavo il movimento fluido delle mie corde vocali e…
Vedevo la mia voce (vi ricordate la sinestesia? ��). Un’emozione grandissima, credo di essermi pure commosso (anzi, conoscendomi lo do per certo).
In sostanza, cosa succede nel mio quotidiano? Normalmente parlo con il mio registro naturale, baritonale (“quello in cui lei, Sig. Nardi, non fa la minima fatica”). Però essendo di natura un entusiasta, appena mi esalto mi parte il picco della frequenza e vado in… vado in… Come si dice più quando il monitor del microfono “spara” sul rosso…? Non mi ricordo, devo chiedere a Sandro e/o a Valentina. Uh, a proposito, ora tocca ai loro articoli…
…Il mio era solo un outing (a voce alta).
Essere-fare-parlare
di Valentina Ferraro “La Musifavolista”
“Voi siete di nicchia”
“Parlate in modo complesso, si fatica a starvi dietro”
“Non siete per tutti”
Quando ho sentito questi feedback mi sono sentita quasi a disagio. A disagio come quando dovevo espormi con la voce le prime volte.
Perché parlare di voce, per me, significa parlare di profondità d’anima, e pensare di arrivare come “complicati” o “elitari” mi fa sentire in antitesi rispetto al proposito divulgativo che mi/ci siamo proposti.
Parlare di voce non è semplice, in qualsiasi modo.
Il gergo tecnico del canto vive di immagini, metafore e analogie funzionali alla comprensione dei meccanismi interni non visibili all’occhio:
”canta indietro”, “falla uscire dalla pancia” “piangila di più” e cose così.
Quando facciamo formazione usiamo supporti visivi, giochiamo con il corpo e con le azioni per trovare il suono che cerchiamo; accompagnare in un percorso vocale è complesso e richiede un vocabolario multifunzionale: come spieghi a qualcuno un meccanismo che non si vede ma si sente?
Quando ti fa male da qualche parte, come descrivi quel dolore?
Se cerchi di contestualizzarlo per farlo capire davvero, ti trovi in difficoltà perché quel dolore lo senti tu, non l’altro, dunque renderlo a parole è sfidante.
Così è per la voce.
Il movimento fonatorio è proprio/enterocettivo e non è possibile pensare di poter parlare un unico linguaggio che arrivi a tutti nella stessa maniera, a maggior ragione perché parliamo di voce, dunque di ascolto e di percezione individuale.
Certo, forse noi ci lasciamo trasportare dal vento della passione e spieghiamo le vele su rotte inusuali, trovandoci a parlare di voce che veste come un abito, che rivela le condizioni dell’organismo, che connota un sistema di apprendimento o che denota una filosofia, ma il nostro parlare di voce è ciò viviamo sulla pelle tutti i giorni.
Di nuovo (e forse questo arriverà come provocatorio) mi trovo a considerare che anche il modo in cui parliamo di voce racconta di come per noi è il rapporto con la nostra voce, di quanto ce ne curiamo, di quanto la viviamo come indissolubile espressione dell’essere.
Dunque di nuovo, il modo in cui parliamo di voce si allinea al modo in cui facciamo voce, in quell’asse fare-essere, o incarnare, che penso sia indispensabile a chi voglia creare dialogo e relazione intorno ad un argomento.
Così è per me e, mi permetto di dirlo, per i miei colleghi.
Parliamo di voce nello stesso modo in cui viviamo la voce: con la bussola verso nord e il cuore degli esploratori.
Che poi, se ci penso bene, nel 2013 mi interessavo al Voice Healing e parlavo di Voce Selvaggia, l’ho esplorata nella diplofonia, nella glossolalia, nei canti sacri e nel canto intuitivo; come può, per me, la voce non essere anima?
Voce come musica (soprattutto per l’intelligenza artificiale)
di Sandro Ghini
Sicuramente l’arrivo al grande pubblico dei sistemi di Text to Speech basati su intelligenza artificiale (A.I.) spaventa gran parte di chi con la voce lavora. Mi piace però guardare le cose da un altro punto di vista e prendere questo momento storico come un’opportunità. No non sto parlando di come possiamo usare le voci sintetiche per creare contenuti o fare marketing ma di guardare, anzi forse sarebbe più corretto sentire, le cose con orecchie nuove.
Quando iniziamo a dare un nome alle cose che vediamo o sentiamo? Quando dobbiamo concordare sulle caratteristiche da associare a quel fenomeno percettivo per comunicare con altri e per poterlo replicare. La storia dei nomi dei colori nelle varie culture del mondo è lunga e interessantissima ad esempio… ma quando parliamo di voce?
Ecco ora siamo nell’esatto momento in cui possiamo osservare il processo di decostruzione, codifica e ricostruzione di una percezione per replicarla fedelmente potenzialmente all’infinito. Chi sta lavorando alle intelligenze artificiali che stanno tentando di replicare la voce umana ha prima di tutto dovuto chiedersi di quali parametri è composta e come catalogarli e mapparli.
Mi ha colpito una delle tante strade intraprese, quella di Nvidia, azienda informatica famosa per la produzione di schede video ( e non solo ovviamente ). In questo video e nelle pubblicazioni successive il team di sviluppo della loro A.I. proprietaria racconta come il cardine della verosimiglianza di una voce sia la musicalità.
La voce è come una musica e riproducendo le giuste intonazioni si può dare credibilità al parlato artificiale
Chiaramente dietro a questa apparentemente banale proposizione si nasconde un mondo di complessità dovuta al cosa generi le linee melodiche. Emozioni, intenzioni, contesto e caratteristiche timbriche e prosodiche personali.
Ho provato così a domandare ad una collega di questa A.I. in sviluppo, Chat GPT, di raccontarmi come vengono riconosciute le emozioni in un testo:
Il riconoscimento delle emozioni nel testo è un'area di ricerca attiva nel campo del linguaggio naturale e dell'intelligenza artificiale. Esistono diverse tecniche utilizzate per riconoscere le emozioni nel testo e applicarle alla sintesi vocale. Ecco alcuni metodi comuni:
Analisi lessicale: Questo approccio coinvolge l'analisi del testo alla ricerca di parole o frasi che sono indicative di determinate emozioni. Viene utilizzato un insieme di parole chiave o un dizionario emotivo predefinito che associa parole a emozioni specifiche. Le parole rilevanti vengono identificate nel testo e le emozioni corrispondenti vengono assegnate.
Classificazione del testo: Utilizzando tecniche di classificazione del testo, come l'apprendimento automatico supervisionato, è possibile addestrare modelli per riconoscere le emozioni nel testo. I modelli vengono addestrati utilizzando un insieme di dati etichettati in cui il testo è associato a un'emozione specifica. Durante l'applicazione, il modello classifica il testo in una o più emozioni corrispondenti.
Apprendimento automatico basato sul contesto: Questo metodo coinvolge l'uso di modelli di apprendimento automatico, come reti neurali, che considerano il contesto circostante per riconoscere le emozioni nel testo. Questi modelli apprendono le relazioni complesse tra le parole e le strutture linguistiche, consentendo di comprendere meglio il significato emotivo del testo.
Approcci basati sulla semantica: Questo approccio coinvolge l'analisi semantica del testo per riconoscere le emozioni. Vengono utilizzati modelli di rappresentazione semantica, come word embeddings o modelli basati su ontologie, per catturare il significato delle parole nel contesto emotivo. I modelli possono essere addestrati utilizzando dati annotati con emozioni o possono trarre vantaggio da risorse linguistiche preesistenti.
Questi metodi possono essere utilizzati singolarmente o in combinazione per riconoscere le emozioni nel testo da leggere con la voce sintetica. Una volta che le emozioni sono state riconosciute, possono essere utilizzate per guidare la sintesi vocale nell'applicare l'intonazione emotiva appropriata durante la generazione del discorso sintetico attraverso questi approcci:
Etichettatura delle emozioni: In questo approccio, viene assegnata un'etichetta emotiva a ciascuna porzione di testo da sintetizzare. Le etichette emotive possono rappresentare diverse emozioni come felicità, tristezza, rabbia, ecc. I modelli di sintesi vocale possono essere addestrati utilizzando dati vocali etichettati con emozioni corrispondenti. Durante la sintesi, il modello utilizza queste etichette emotive per generare un discorso con l'intonazione appropriata.
Modelli prosodici: Questo approccio coinvolge l'uso di modelli prosodici specifici per ciascuna emozione. I modelli prosodici comprendono parametri come la durata delle sillabe, l'intensità e la variazione del tono. Durante la sintesi, i parametri prosodici corrispondenti all'emozione desiderata vengono applicati al testo da sintetizzare per conferire l'intonazione emotiva desiderata.
Generazione condizionale: Con l'utilizzo di reti neurali generative condizionali (Conditional Generative Networks - CGN), è possibile generare il discorso sintetico in modo condizionale all'emozione specificata. Durante l'addestramento, il modello apprende a generare le caratteristiche prosodiche appropriate per ciascuna emozione. Durante la sintesi, il modello viene condizionato all'emozione desiderata per generare il discorso con l'intonazione emotiva corrispondente.
Trasferimento dello stile: Questo metodo coinvolge l'applicazione di tecniche di trasferimento dello stile, che permettono di "trasferire" l'intonazione emotiva da una voce di riferimento a una voce sintetica. Vengono utilizzati modelli di apprendimento automatico per estrarre le caratteristiche prosodiche della voce di riferimento, come l'intonazione, il ritmo e l'accento, e applicarle alla voce sintetica per ottenere l'intonazione emotiva desiderata.
Oltre a spaventarci e inquietarci un po’ questo come può esserci utile nel lavorare sulla nostra voce?
In innumerevoli modi ma mi concentro su uno in particolare: la consapevolezza:
consapevolezza del fatto che la voce si faccia attraverso uno strumento a tutti gli effetti (il vocal tract e più in esteso tutto il nostro corpo);
consapevolezza che le parole che scegliamo di usare sono importanti ma è il come le articoliamo e facciamo suonare a renderci umani
consapevolezza che prima di tutto la voce è una piattaforma di relazione e in quanto tale la nostra attenzione dovrebbe andare all’effetto pragmatico: ovvero la risposta che suscitiamo negli altri.
https://blogs.nvidia.com/blog/2021/08/31/conversational-ai-research-speech-synthesis-interspeech/?ncid=so-yout-760781#cid=dl20_so-yout_en-us
Nel frattempo in Academy…
Menzione d’onore alla nostro corsista Anna Maria Pignatti, che ha sfida di maggio della nostra academy; ogni mese, infatti, ci sfidiamo a suon di voce, leggendo brani e votando tutti insieme la lettura più efficace.
Anna Maria è con noi da diverso tempo e ci ha letteralmente incantati nella lettura di un romanzo rosa.
Ti vedo già che storci il naso alle parole “romanzo rosa” ma fidati: è stata bravissima!
Se vuoi vivere la nostra etica in un percorso formativo su voce, lettura espressiva e comunicazione paraverbale, l’academy è sempre aperta per tutti i curiosi, i creativi e gli esploratori.
Grazie! Super suggestivo.