Skip to Main Content (Press Enter)

Logo UNIMORE
  • ×
  • Home
  • Corsi
  • Insegnamenti
  • Professioni
  • Persone
  • Pubblicazioni
  • Strutture
  • Terza Missione
  • Attività
  • Competenze

UNI-FIND
Logo UNIMORE

|

UNI-FIND

unimore.it
  • ×
  • Home
  • Corsi
  • Insegnamenti
  • Professioni
  • Persone
  • Pubblicazioni
  • Strutture
  • Terza Missione
  • Attività
  • Competenze
  1. Attività

Beyond Parliament: AI-Enhanced Multilingual Corpus Using Innovative Methodology for Non-Institutional Political Speeches in German, French, Spanish and Italian

Progetto
Il progetto di ricerca mira a condurre uno studio approfondito sugli aspetti scientifici, tecnici e legati al copyright nella creazione di un corpus multilingue. Questo corpus, che sfrutterà i più recenti progressi nell'intelligenza artificiale, offrirà trascrizioni nel campo del discorso politico orale e servirà come base per studi internazionali di linguistica politica. L’obiettivo principale del progetto è costruire un corpus e analizzare i discorsi politici non istituzionali in tedesco, francese, spagnolo e italiano. Verrà sviluppata una metodologia che utilizzi strumenti web, sistemi di riconoscimento automatico del parlato (Automatic Speech Recognition, ASR) e sistemi di trascrizione basati sull’intelligenza artificiale per trascrivere, segmentare, annotare e analizzare ortograficamente i discorsi raccolti. Inoltre, verrà effettuata un’analisi prosodica dei discorsi, sperimentando metodi che consentano di esaminare la relazione tra la prosodia e altri aspetti linguistici, come le scelte lessicali e le metafore. I risultati dell’analisi prosodica saranno inclusi nel corpus. Per "discorsi non istituzionali" si intendono quelli non pronunciati in contesti parlamentari, ma in occasioni come convenzioni politiche o comizi durante campagne elettorali. La scelta di concentrarsi su discorsi non istituzionali deriva da diversi motivi: innanzitutto, i discorsi parlamentari vengono generalmente trascritti con l’aiuto di sistemi ASR e poi revisionati da stenografi, eliminando così molte delle tipiche caratteristiche orali. Inoltre, questi discorsi spesso vengono letti, risultando più simili alla lingua scritta che a quella parlata. I discorsi non istituzionali, al contrario, non sono stati ancora studiati a fondo dagli accademici, probabilmente a causa delle difficoltà di trascrizione. I video di questi discorsi sono disponibili su piattaforme come YouTube, ma, a differenza dei contesti parlamentari, le registrazioni spesso presentano una qualità audio inferiore a causa del rumore di fondo, rendendo la trascrizione complessa. Anche se il corpus si baserà principalmente su trascrizioni sulle locuzioni, informazioni cruciali sul contesto visivo potranno essere annotate nella sezione dei commenti degli strumenti di trascrizione. Documentare gli elementi non verbali insieme ai dati audio è essenziale per analizzare le caratteristiche prosodiche, come intonazione, accenti e ritmo. Considerando sia gli aspetti verbali che non verbali, i ricercatori potranno ottenere interpretazioni più sfumate, arricchendo la comprensione complessiva dei discorsi politici. Il progetto intende implementare una metodologia su misura per analizzare i discorsi non istituzionali. Il risultato sarà un corpus di discorsi, reso disponibile per studi di linguistica politica e analisi del discorso in generale. Questo corpus rappresenterà un modello che combina trascrizioni ortografiche con analisi più approfondite, incluse quelle prosodiche. Inoltre, verrà sviluppata una piattaforma collaborativa dove saranno disponibili le trascrizioni dei discorsi in tedesco, francese, spagnolo e italiano pronunciati durante campagne elettorali, con i riferimenti ai relativi video e file audio.
  • Dati Generali
  • Competenze

Dati Generali

Partecipanti (4)

GANNUSCIO Vincenzo   Responsabile scientifico  
KAUNZNER ULRIKE ADELHEID   Partecipante  
MODENA SILVIA   Partecipante  
ZARCO Gloria Julieta   Partecipante  

Dipartimenti coinvolti

Dipartimento di Studi Linguistici e Culturali   Principale  

Tipo

FAR 2024 Progetti interdisciplinari - Linea UNIMORE

Finanziatore

ATENEO
Ente Finanziatore

Partner

Università degli Studi di MODENA e REGGIO EMILIA

Contributo Totale (assegnato) Ateneo (EURO)

59.556€

Periodo di attività

Dicembre 2, 2024 - Dicembre 1, 2026

Durata progetto

24 mesi

Competenze

Settori (6)


SH4_11 - Pragmatics, sociolinguistics, linguistic anthropology, discourse analysis - (2024)

SH4_9 - Theoretical linguistics; computational linguistics - (2024)

Settore FRAN-01/B - Lingua, traduzione e linguistica francese

Settore GERM-01/C - Lingua, traduzione e linguistica tedesca

Settore LIFI-01/A - Linguistica italiana

Settore SPAN-01/C - Lingua, traduzione e linguistica spagnola
  • Utilizzo dei cookie

Realizzato con VIVO | Designed by Cineca | 25.10.0.6