Un sillabatore per la metrica italiana (bozza)
con note sull’analisi fonetica del verso
Introduzione
A partire dalle regole della tradizione grammaticale è stato sviluppato, con metodo empirico, uno strumento informatico per la sillabazione automatica e l’analisi metrica dei versi della poesia italiana.
Lo strumento produce una segmentazione sillabica del verso, identifica le figure metriche (sinalefe, dialefe, sineresi, dieresi), riconosce il metro prevalente e genera un profilo ritmico-musicale multi-modale. Successivamente, al sillabatore è stato affiancato un modulo di analisi fonetica basato sulla trascrizione IPA. Come corpus di validazione, la scelta ovvia è caduta sulla Divina Commedia, riletta in una classificazione tentativa in sei strati, descritti più avanti. I risultati mostrano che alcune misure quantitative — in particolare l’indice di alternanza fonetica (Alt) — si comportano come indicatori della «temperatura poetica» del verso, consentendo una classificazione empirica dei versi danteschi per registro e intensità espressiva.
1. Motivazione e contesto
L’analisi metrica computazionale della poesia italiana dispone di strumenti specialistici, sviluppati prevalentemente in ambito accademico, spesso orientati a testi o finalità specifiche, quali le necessità di catalogazione. Obiettivo di questo lavoro è di rendere disponibile uno strumento interattivo, accessibile nel browser, capace di analizzare qualsiasi testo in versi e restituire all’utente una rappresentazione visiva e numerica della sua struttura metrico-musicale.
Il punto di partenza è stato la sillabazione automatica, problema apparentemente tecnico ma in realtà ricco di eccezioni e ambiguità che riflettono la storia fonetica della lingua italiana. Un sillabatore affidabile è il prerequisito di qualsiasi analisi metrica: senza una segmentazione corretta, il conteggio delle sillabe metriche e il riconoscimento delle figure non è possibile.
2. Il motore di sillabazione
Il nucleo dello strumento è un motore di sillabazione fonologica, non basato su dizionari di lingua, sviluppato a partire dalle regole codificate nella tradizione grammaticale italiana, con riferimento particolare a quanto descritto dall’Accademia della Crusca e ai principi della fonologia sillabica. Il motore implementa le seguenti regole principali:
- separazione vocale-consonante secondo il principio dell’onset massimale;
- gestione dei gruppi consonantici impropri (sc, str, spr, ecc.);
- trattamento dei dittonghi e degli iati;
- sillabazione delle parole con apostrofo (elisione grafica): la forma unita viene passata al motore e il segno reintrodotto nella posizione originale.
Per le eccezioni e i casi non risolvibili algoritmicamente, il motore ricorre a un dizionario di forme irregolari costruito empiricamente. L’accuratezza stimata sul testo poetico classico è di circa il 92%.
3. Figure metriche e conteggio sillabico
La metrica italiana non opera sulla sillaba fonetica ma sulla sillaba metrica, che è determinata dall’applicazione di figure retoriche di natura fonica. Lo strumento gestisce automaticamente:
Sinalefe: fusione in un’unica sillaba metrica di una vocale finale e di una vocale iniziale della parola successiva. È la figura più frequente e la più necessaria per la scansione regolare dell’endecasillabo.
Dialefe: mancata applicazione della sinalefe, con mantenimento delle due sillabe distinte. Utilizzata da Dante in alcune posizioni specifiche, soprattutto alla cesura.
Sineresi: riduzione di due vocali contigue all’interno di parola a una sola sillaba metrica. Frequente nei dittonghi non canonici.
Dieresi: separazione di un dittongo in due sillabe metriche distinte, segnalata tradizionalmente con il segno ¨.
Il riconoscimento delle figure avviene in due passaggi: prima una valutazione locale verso per verso, poi un aggiustamento contestuale basato sulla distribuzione metrica nella strofa o nel brano.
4. Riconoscimento del metro e del profilo ritmico
Una volta determinato il conteggio sillabico, lo strumento assegna il metro prevalente (endecasillabo, settenario, novenario, ecc.) confrontando il profilo accentuale del verso con un insieme di schemi metrici canonici. Il confronto avviene tramite correlazione di Pearson tra il vettore degli accenti rilevati e i vettori degli schemi di riferimento.
Il profilo ritmico visualizzato nell’interfaccia mostra per ogni sillaba la presenza o assenza di accento, con indicazione degli accenti di 4ª, 6ª e 10ª posizione — le posizioni strutturali fondamentali dell’endecasillabo. Il badge di conferma metrica (♩11✓) segnala i versi in cui il riconoscimento automatico è ritenuto affidabile.
5. Lo score di musicalità multi-modale
Accanto all’analisi metrica stricto sensu, lo strumento calcola uno score di musicalità composto da quattro componenti indipendenti:
- M1 — Vocalica: misura la coerenza del pattern delle vocali toniche, l’assonanza e il profilo di apertura vocalica lungo il verso.
- M2 — Consonantica: misura l’allitterazione delle consonanti iniziali e la coerenza delle classi consonantiche (labiali, velari, dentali, liquide, sibilanti).
- M3 — Ritmica: derivata dalla correlazione con gli schemi metrici, corretta per la densità accentuale e il peso sillabico delle parole.
- M4 — Strutturale: misura la presenza di figure etimologiche, anafore e simmetrie nella disposizione delle vocali toniche.
Lo score finale è una media pesata con esponente (power mean) che privilegia i picchi: un verso con una componente molto alta viene premiato anche se le altre sono moderate. Per l’endecasillabo con accento di 10ª è garantito un floor minimo di M3=0.68.
6. Il modulo di analisi fonetica IPA
In una fase successiva, separatamente dallo strumento principale, è stato sviluppato un modulo di analisi fonetica basato sulla trascrizione IPA automatica del testo italiano. Il convertitore grafema→IPA implementa le principali regole fonologiche dell’italiano standard (palatalizzazione, assibilazione, affricate, doppie, nessi consonantici) con un’accuratezza stimata sufficiente per l’analisi statistica su corpus ampi.
A ogni fono IPA vengono assegnati valori numerici su una scala di peso articolatorio raffinata empiricamente:
| Categoria | i u j w | m n ɲ | e o / l ʎ | r / ɛ ɔ | v z / f s ʃ | b d g / p t k |
| Peso | 1 | 1 | 2 | 3 | 4–5 | 6–7 |
La scala distingue le vocali alte e le nasali (peso 1, massima sonorità) dalle occlusive sorde (peso 7, massima tensione articolatoria), con gradazioni intermedie per liquide, fricative e affricate. Le consonanti doppie ricevono un peso incrementato di 1 rispetto alla corrispondente semplice.
7. Gli indici fonetici
Dalla sequenza di pesi fonetici vengono calcolati i seguenti indici per ogni verso:
| Indice | Formula sintetica | Descrizione |
| Alt | conteggio transizioni V↔C | Numero di alternanze tra fonemi vocalici e consonantici nella sequenza IPA. Misura la fluidità fonetica strutturale del verso. |
| μ (mu) | Σ pesi / n | Peso medio articolatorio. Basso: prevalenza di suoni leggeri (vocali, nasali). Alto: prevalenza di occlusive e fricative. |
| σ (sigma) | √(Σ(pᵢ−μ)²/n) | Deviazione standard dei pesi. Misura il contrasto interno: versi con σ bassa sono foneticamente omogenei. |
| Rug | Σ|pᵢ−pᵢ₋₁|/(n−1) | Rugosità: variazione media tra fonemi adiacenti. Alta rugosità indica transizioni brusche, bassa rugosità indica fluidità. |
| Asim. | μ(II°)−μ(I°) | Asimmetria emisticale: differenza di peso medio tra seconda e prima metà del verso. Misura la direzione dell’onda fonetica. |
| Entr. | −Σ pᵢ log₂ pᵢ | Entropia di Shannon sulle categorie foniche. Alta entropia: ricchezza e varietà fonica. Bassa: predominanza di poche categorie. |
| DistP | distanza media inter-picco | Distanza media tra elementi di peso ≤3 (suoni aperti). Misura la densità e la periodicità dei momenti sonori del verso. |
| VarP | varianza delle distanze | Varianza delle distanze inter-picco. Bassa: ritmo periodico e regolare. Alta: distribuzione irregolare degli elementi sonori. |
| Cus. | conteggio posizioni specifiche | Cuscinetti: liquide o nasali tra elementi di peso ≥6. Misura la presenza di ammortizzatori fonetici tra le consonanti pesanti. |
8. Validazione
Il modulo IPA è stato applicato all’intero corpus della Divina Commedia: oltre 14.000 versi, una varietà di registri e toni straordinaria, secoli di lettura e letteratura critica. I versi sono stati classificati con rilettura “umana” e, ovviamente, soggettiva, in sei categorie secondo un criterio “stratigrafico”, non gerarchico, a segmenti, valutando prima la qualità metrico-musicale (A: versi campione; B: versi di rango; C: versi funzionali), quindi il contenuto semantico (emozionale, classico, dialogico, narrativo).
| # | Strato |
| 1 | Emozionale |
| 2 | Classico |
| 3 | Classico-narrativo |
| 4 | Dialogato |
| 5 | Narrativo |
| 6 | Altri |
8.1 Alt come indicatore di registro
La scoperta più significativa è che l’indice Alt — il conteggio grezzo delle alternanze V/C nella sequenza IPA — si comporta come un indicatore continuo della «temperatura poetica» del verso, con una distribuzione che rispecchia la gerarchia espressiva del poema:
| Registro | Alt tipico | Versi |
| Neologismi, latinismi, onomatopeici | ||
| Classici piani e distesi | ||
| Emotivi di alta classicità | ||
| Passionali, intensa emotività | ||
| Discorsivi, ritmici, dialogati | ||
| Narrativi (tutti i livelli) |
La distribuzione è coerente con la lettura critica del testo: i versi con Alt=21 includono versi iconici della nostra letteratura: «E quindi uscimmo a riveder le stelle» e «Tanto gentile e tanto onesta pare»; i versi con Alt=19 includono «Caron dimonio, con occhi di bragia» e «la bocca mi baciò tutto tremante».
8.2 Invarianza dell’emotività attraverso le cantiche
Un risultato inatteso riguarda la classe degli “emozionali” attraverso le tre cantiche. Nonostante lo shift semantico radicale — dalla paura e disperazione dell’Inferno alla beatitudine e all’estasi del Paradiso — la firma fonetica della classe rimane quasi identica (Alt ≈ 19.5, μ ≈ 3.57, σ ≈ 2.03 nelle tre cantiche). Dante usa la stessa costruzione fonetica del verso per emozioni opposte: cambia il significato, non la musica.
8.3 Crescita dei versi classici verso il Paradiso
La distribuzione per classe mostra che i versi “classici” crescono monotonicamente da Inferno a Paradiso (672 → 927 → 1664). Il Paradiso ha quasi il triplo dei versi di massima qualità formale rispetto all’Inferno. Dante diventa più «classico», se possibile, mentre sale.
9. La forma d’onda fonetica e la firma di registro
Accanto agli indici numerici, lo strumento visualizza per ogni verso un profilo fonetico a barre — una rappresentazione grafica diretta della sequenza dei fonemi. Ogni fonema è rappresentato da una barra di larghezza fissa e altezza proporzionale al suo peso articolatorio; il colore indica la categoria fonica di appartenenza. Il risultato è una forma d’onda del verso: leggibile a colpo d’occhio, immediatamente comparabile tra versi diversi.
La larghezza totale del profilo è proporzionale al numero di fonemi del verso, il che rende visibile anche la densità fonica: un verso breve e aperto occupa meno spazio di un verso pieno di consonanti doppie e cluster. L’occhio coglie in un istante quello che i numeri descrivono analiticamente.
9.1 I sei registri e i loro range
La firma di registro assegna a ogni verso un’etichetta cromatica basata sul valore di Alt e sui parametri medi misurati sull’intera Commedia. Le sei classi non sono categorie teoriche ma emergono empiricamente dalla distribuzione dei 14.230 versi del poema:
| Registro | Alt | μ | σ | Entr. | N versi | Colore |
| Narrativo | grigio azzurrato | |||||
| Discorsivo | verde salvia | |||||
| Emozionale | ambra | |||||
| Classico emotivo | ocra dorata | |||||
| Classico | bordeaux tenue | |||||
| Latinismi/altro | viola grigio |
Il colore assegnato a ogni verso non è un giudizio di valore ma una collocazione in una mappa di registro: un verso narrativo è necessario quanto un verso classico, e il poema vive della loro alternanza. La progressione cromatica dal freddo al caldo e poi al bordeaux segue la progressione emotiva delle classi, non una gerarchia qualitativa.
9.2 I micro-indicatori a fianco della firma
Accanto al nome del registro, quattro micro-indicatori descrivono la posizione del verso rispetto alla media della sua classe: μ (peso medio articolatorio), σ (contrasto interno), Entr (entropia fonica), Asim (asimmetria emisticale). Ogni indicatore è accompagnato da un piccolo punto cromatico che diminuisce di intensità quanto più il valore si discosta dalla media di classe.
Un verso emozionale con σ molto alta rispetto alla media della sua classe è un verso di intensa disomogeneità interna — probabilmente un verso di climax. Un verso classico con asimmetria marcatamente positiva ha la seconda metà più pesante della prima: l’onda chiude in basso, su una consonante dura. Questi dettagli sono leggibili visivamente senza dover interpretare i numeri.
9.3 La forma d’onda come strumento di lettura
La forma d’onda a barre non sostituisce la lettura critica — la affianca. Alcune cose che l’occhio coglie direttamente:
- un profilo con barre prevalentemente basse e colori chiari è un verso leggero, aperto, vocale. Un profilo con molte barre alte e scure è un verso duro, occlusivo, fisicamente impegnativo
- un profilo regolare, con alternanza ritmica di barre alte e basse, corrisponde a un Alt elevato e a una periodicità fonica stabile
- un profilo con un blocco di barre alte concentrato in un punto corrisponde a un verso asimmetrico: l’energia fonica è distribuita in modo irregolare
Due versi danteschi classici illustrano con evidenza visiva la differenza: «tanto gentile e tanto onesta pare» mostra un profilo ondulato e regolare, con vocali aperte e liquide che si alternano alle occlusive quasi periodicamente: è la forma d’onda di un verso classico disteso, «la bocca mi basciò tutto tremante» mostra invece un blocco centrale di occlusive denso e compatto, con le vocali che si distribuiscono ai lati: è la forma d’onda dell’emozione fisicamente incarnata, delle labiali che mimano il gesto del bacio.
È questa la ragione per cui la visualizzazione a barre aggiunge qualcosa che i numeri da soli non trasmettono: restituisce la texture del verso, la sua fisicità fonetica, in una forma che il lettore può percepire direttamente.
10. Note informatiche, limiti e sviluppi futuri
Lo strumento è stato realizzato interamente con codice JavaScript lato client (sia funzionale che procedurale), affiancato da HTML e CSS per il frontend. Essendo un’applicazione client-side pura, risulta completamente portabile e non richiede alcuna installazione o infrastruttura lato server.
Lo strumento di sillabazione raggiunge circa il 92% di accuratezza sul testo poetico classico; i casi residui riguardano principalmente le eccezioni lessicali e alcune strutture ritmiche non canoniche. Il modulo IPA è adatto all’analisi del verso singolo e di corpus selezionati; su corpus ampi le medie tendono a livellare il segnale, rendendo difficile la discriminazione fine tra classi.
La classificazione tipologica applicata alla Commedia è stata condotta da un lettore singolo e non ha la pretesa di essere sistematica; va intesa come uno strumento esplorativo. La scala di pesi articolatori è stata calibrata empiricamente e meriterebbe una validazione percettiva con ascolto di testi recitati.
Sviluppi possibili includono: l’integrazione del profilo fonetico IPA nell’interfaccia del sillabatore come layer descrittivo; l’estensione del corpus a altri poeti della tradizione italiana; lo studio dell’autocorrelazione della sequenza di pesi come misura di periodicità ritmica.
© Alberto Bellani 23 marzo 2026
