Proiectarea si Inregistrarea unei Baze de Date Verbal-Emotionala pentru o Culegere de Texte de Sinteza in Limba Basca

Extras din referat Cum descarc?

Abstract
Aceasta lucrare descrie o baza de date verbale- emotionale inregistrata pentru limba Basca standard. Baza de date a fost proiectata cu scopul dublu de a fi folosita pentru culegerea de texte de sintezade baza, si de asemenea pentru a permite studiul de modelele prozodice pentru emotii. Baza de date este astfel vasta, pentru a avea o buna calitate a sintezei de baza a codicelui si contine aceleasi texte inregistrate pentru cele sase emotii de baza plus stilul neutru. Inregistrarile au fost efectuate de doi actori vocali profesionisti, un barbat si o femeie. Lucarea explica intregul proces de creere, incepand cu faza de design, urmata de creerea culegerii de texte si faza inregistrarilor, si terminand cu niste lectii si sugestii
2.1 Introducere
In ultimii ani, progresul in domeniul sintezei lingvistice a trecut in mare masura de punctul de rascruce al inteligibilitatii, impingand eforturile de cercetare inspre zona fluentei si a naturaletii. Aceste caracteristici devin din ce in ce mai necesare pe masura ce sarcinile de sinteza devin din ce in ce mai complaexe: sunetul natural, fluenta si intonatie buna sunt obilgatorii pentru ca un text lung sintetizat sa fi inteles.
Cautand naturalete, metodele de sinteza bazate pe un codice au aparut pe la jumatatea secolului trecut. Aceste metode folosesc tehnici concatenative de sinteza lingvistica si incearca sa minimizeze manipularea semnalului. In acest fel se pastreaza naturaletea originala a limbajului micsorand numarul de legaturi dintre fragmentele verbale prin folosirea algoritmilor de selectie a blocurilor, care avantajaza blocurile mari.
Pe de alta parte scopul imbunatatirii fluentei si al intonatiei a dus la dezvoltarea a numeroase domenii de cercetare. Unul dintre cele mai importante este includerea vorbirii emotionale in vorbirea sintetica. In prezent grupul nostru de cercetare studiaza caracteristicile vorbirii emotionale Basce. Pentru a avansa in acest domeniu este necesara o baza de date vasta special creata.
Aceasta lucare descrie efectele dorite ale bazei de date, mai intai detaliind problemele aduse de munca de modelare a creerii emotiilor si apoi cele create de obiectivele de sinteza ale selectiei blocurilor. Apoi procesul de creere al codicelui si descrierea trasaturilor lui finale, in continuare va fi explicata faza inregistrarilor acoperind si faza selectiei vocilor, a echipamentelor si detaliile efectuarii sesiuniilor de inregistrari. In sfarsit vom prezenta niste concluzii.
2.1 Cerintele pentru modelarea emotiilor
Studiul modelelor emotiilor prozodice necesita mostre inregistrate al tuturor emotiilor de baza. Am luat in consiterare setul de emotii cunoscut si ca ,,Marele sase" (Cowie & Cornelius, 2003): tristete, fericire, furie, frica, surpriza si desgust. In plus s-a luat in considerare si stilul neutru
Stiluri diferite de codice au fost folosite pentru studiul emotiilor in scris, in incercarea de a obtine cea mai buna autenticitate a emotiilor. Altii au folosit emotii deduse prin punerea vorbitorului in situatii care sa nasca o anumit emotie. O a treia optiune a fost folosirea unui interpret cu studii de actorie ce putea simula emotii. Desi acesta din urma tindea sa exagereze emotiile, totusi acestea sunt recunoscute , astfel incat modelarea practica poate fi derivata din ele. In aceasta munca am folosit codicele de vorbire jucat deoarece el este singurul care permite control complet asupra textului inregistrat.
Intrucat folosirea textelor diferite pentru fiecare emotie implica dificultati mari pentru a gasi codicele continand textele corespunzatoare, si, mai mult, el impiedica compararea caracteristicilor diferitelor emotii, s-a decis sa nu se foloseasca astfel de texte, inregistreand acelasi text independent de emotii pentru toate acestea. In plus, studii anterioare au aratat ca un interpret iscusit poate exprima emotii natural chiar daca continutul textului nu are legatura cu emotia .
2.1 . Controlul variatiilor interpretului
Studii anterioare ne-au invatat de asemenea ca este imposibil pentru interpreti sa mentina un nivel de referinta constant pentru ritmul, tonul si volomul lor intr-o sesiune de inregistrari de lunga durata. Timpul estimat pentru inregistrarea acestei baze de date s-a intins pe mai multe sesiuni de inregistrari, deci efectele acestor variatii trebuiau sa fie chiar mai insemnate. Pentru a cuantifica aceste deviatii si a fi in continuare capabil sa comparm parametrii prosodici intre emotii, s-a creat si un text de control.
Acest text de control consta inr-un scurt text continuu (lung de 400 de cuvinte), ce a trebuit citit cu stilul neutru, la inceputul, mijlocul si sfarsitul fiecarei sesiuni. In acest fel nivelele de referinta in parametrii prosodici pentru fiecare sesiune vor fi extrasi din acest text de control si datele fiecarei emotii vor fi normalizate conform acestor nivele de referinta.
2.2. Nivelul prosodic al supra-sintaxei
Ultimul factor al studiilor prosodice care are un impact asupra cerintelor creerii bazei de date, era necesitatea de a studia prosodia de limbaj aplicata nivelului propozitiei. Dupa cum se va arata in urmatoarea sectiune, partea principala de text interpretat avea sa fie compusa din propozitii izolate, ceea ce este foarte convenabil pentru extragerea modelelor prosodice la nivel de propozitie ( cu exceptia modelului cu pauza), cat si pentru a servi la alte scopuri ale activarii selectiei de blocuri. Totusi, este de asemenea necesar sa studiem diferite stiluri de vorbire cu ar fi dialogurile, partile declarative, pauzele de paragraf etc. Ce necesita text continuu.
De aceea s-a mai adaugat o noua piesa bazei de date : un text continuu de marime medie: (1,047 cuvinte), care acoperea stiluri de vorbire diferite precum dialoguri si descrieri. Acest text se intentiona a fi citit in toate cele 6 emotii plus stilul neutru , toate inregistrate dintr-o data.
2.3. Structura bazei de date
Tinand seama de cele de mai sus structura bazei de date este definita de tabelul de mai jos:
Tabel 1. Structura bazei de date
Sectiune Nr. De Inregistrari Continut
Codicele Principal O data / emotie + stilul neutru Propozitii izolate
Textul Continuu O data / emotie + stilul neutru Un singur text continuu cu stiluri variate de vorbire
Textul de Control De trei ori / sesiune de unregistrari O singura bucata de text continuu
3. Cerintele tehnicilor de selectare a blocurilor
In sectiunea anterioara am vazut ca studiul prosodic a pus probleme ce afectau structura externa a bazei de date. In aceasta sectiune vom vedea ca obiectivul sintezei selectiei blocurilor va seta cerintele pentrul continutul textului bazei de date: structura ,,interna".


Fisiere in arhiva (1):

  • Proiectarea si Inregistrarea unei Baze de Date Verbal-Emotionala pentru o Culegere de Texte de Sinteza in Limba Basca.doc

Imagini din acest proiect Cum descarc?

Promoție: 1+1 gratis

După plată vei primi prin email un cod de download pentru a descărca gratis oricare alt referat de pe site.Vezi detalii.


Descarcă aceast referat cu doar 4 € (1+1 gratis)

Simplu și rapid în doar 2 pași: completezi adresa de email și plătești. După descărcarea primului referat vei primi prin email un alt cod pentru a descărca orice alt referat.

1. Numele, Prenumele si adresa de email:

Pe adresa de email specificata vei primi link-ul de descarcare, nr. comenzii si factura (la plata cu cardul). Daca nu gasesti email-ul, verifica si directoarele spam, junk sau toate mesajele.

2. Alege modalitatea de plata preferata:


* Prețul este fără TVA.

Hopa sus!