
ՍԿՍԱԾ Է ԱՐԵՒՄՏԱՀԱՅԵՐԷՆ TTS ԵՒ STT ԳՈՐԾԻՔՆԵՐՈՒ ԿԱՌՈՒՑՈՒՄԸ
ՎԱՐԴԱՆ ԹԱՇՃԵԱՆ*
Սկսած է արեւմտահայերէն խօսքի ճանաչման (Automated Speech Recognition կամ Speech-to-Text) եւ խօսքի «սինեթզ»ի (Text-to-Speech) շարժիչներու կառուցումը, որուն մասնակցելու հրաւիրուած են արեւմտահայերէն խօսողներ, առանց որեւէ խտրութեան։
Այս շարժիչները չափազանց մեծ կարեւորութիւն պիտի ունենան մեր ապրած թուային դարաշրջանին մէջ արեւմտահայերէնի կենսունակութեան, օգտագործման եւ տարածման համար․ անոնք կոչուած են ըլլալու շատ կարեւոր իրագործումներ անոր թուային յառաջդիմութեան մէջ։
Automated Speech Recognition (ARS) կամ Speech-to-Text (STT) շարժիչները համակարգչային ծրագիր-գործիքներ են, որոնք հնարաւորութիւն կու տան ճանչնալու որեւէ լեզուի բանաւոր խօսքը եւ զայն «կը թարգմանեն», կը վերածեն գիրի՝ համակարգչային լեզուագիտութեան միջոցով։ Համաշխարհային փորձառութեան մէջ STT-ն առաւելաբար կը կիրարկուի բանաւոր խօսքի միջոցով պետական, առեւտրական, ելեւմտական, առողջապահական, մշակութային եւ հանրային այլ կառոյցներու հետ մարդոց յարաբերութիւնները ինքնագործ դարձնելուն մէջ։

Ձայնի «սինթեզ»ի (TTS) շարժիչը ելեկտրոնային գրութիւնները կը վերափոխէ դիւրութեամբ հասկնալի ձայնային հաղորդագրութեան: TTS-ը կրնայ օգտագործուիլ կայքերու յօդուածներ, հեռաձայնի վրայ ստացուած նամակներ, գիրքեր եւ ուսուցողական նիւթեր կարդալու համար: Անիկա շատ պիտանի գործիք մըն է տեսողական հարցեր ունեցող, տարեց կամ գրաճանաչութեան հետ կապուած դժուարութիւններ ունեցող մարդոց համար։
Այս արհեստագիտութեան մէջ հսկայական յառաջդիմութիւն արձանագրուած է աշխարհի մեծ թէ փոքր գրեթէ բոլոր լեզուներուն մէջ․ ժամանակն է, որ արեւմտահայերէնը միանայ անոնց։
Արեւմտահայերէնի պարագային, այս գործիքներու նշանակութիւնը մեծ է յատկապէս կրթութեան, ստեղծագործական գործունէութեան, մշակութային ժառանգութեան պահպանման եւ փոխանցման, ուսման եւ ժամանցի ոլոտներուն մէջ։
Արեւմտահայերէնին համար թուային այս եւ այլ գործիքներ մշակելու նպատակով անհրաժեշտ է ձեւաւորել արեւմտահայերէնի բանաւոր եւ գրաւոր խօսքի հիմնադարան։ Այս աշխատանքը կրնայ իրականանալ մասնակցութեամբ արեւմտահայերէն խօսող 80-140 տարբեր մարդոց, որոնք պէտք է կատարեն որոշ ծաւալի արեւմտահայերէն գրութիւններու ձայնագրութիւններ։
Հիմնադարանը ըստ էութեան բանաւոր եւ գրաւոր խօսքի անհրաժեշտ այն արխիւնն է, առանց որուն խօսք անգամ չի կրնար ըլլալ TTS-ի, STT-ի եւ այդ շրջանակի թուային այլ գործիքներու կառուցման մասին։
Կամաւորներ կոչուած են ձեւաւորելու թուային դարաշրջանի արեւմտահայերէնի գործիքներու մշակման համար անհրաժեշտ գրա-ձայնային ատաղձի շտեմարանը եւ այդ հիմքին վրայ մասնակցելու արեւմտահայերէնի TTS եւ STT առաջին շարժիչներու կառուցման։
ԻՆՉՊԷՍ ՄԱՍՆԱԿՑԻԼ․ ՁԱՅՆԱԳՐԵԼ
Հիմնադարանը ձեւաւորելու համար, ընդամէնը անհրաժեշտ է մուտք գործել կայքը, ընտրել որեւէ գրութիւն եւ ձայնագրել զայն համակարգիչի կամ բջիջային հեռաձայնի օգնութեամբ: Միջին հաշիւով կը պահանջուի 15-20 վայրկեան: Եթէ տարբեր պատճառներով չկարենաք կամ չհասցնէք ձայնագրել ամբողջ գրութիւնը մէկ անգամով, կրնաք այդ ընել աւելի ուշ․ համակարգը պիտի պահպանէ բոլոր մասնակի կամ ամբողջական ձայնագրութիւնները, որոնք դուք կրցած էիք վերբեռնել (upload) նախորդ անգամներուն:
Իբրեւ սկիզբ՝ ձայնագրութեան համար մեր կայքին վրայ տեղադրուած են շուրջ 160 տարբեր պարբերութիւններ, առնուած պոլսահայ-ֆրանսահայ անուանի հրապարագիր Շաւարշ Միսաքեանի գրութիւններէն։ Ընտրութիւնը կատարուած է միայն ու միայն նկատի ունենալով Միսաքեանի լեզուի յատկութիւնները՝ դասական, կուռ եւ պարզ։ Հետագային համալրում պիտի կատարուի այլ հեղինակներէ։ Եթէ կը նախընտրէք ձայնագրել ձեր սեփական գրութիւնը, կրնաք զայն կատարել կայքին վրայ, ուր կայ համապատասխան բաժին մը անոր համար։ Նոյն տեղը կրնաք վերբեռնել ձեր մօտ եղած այլ ձայնագրութիւններ, անոնց գրութիւններով։
Ծրագիրի կատարման համար տարբեր ձայնագրողներու նուազագոյն շեմը 80ն է․ 140 տարբեր ձայնագրողներու պարագային, խօսքի ճանաչումը մօտիկ կ՛ըլլայ կատարեալին, իսկ աւելին արդէն կ՛ապահովէ միանշանակ ճանաչում բոլոր պարագաներուն: Ընդհանուրը, կարիքը կայ շուրջ 500 ժամ ձայնագրութեան՝ լաւագոյն արդիւնքին համար։
Ձայնագրութիւններու կատարման համար, կայքին վրայ արձանագրուիլը անհրաժեշտ է: Մասնակցողներու անունները պիտի գրուին արեւմտահայերէն խօսքի ճանաչման առաջին գործիքը մշակողներու ցանկին վրայ՝ իբրեւ պատմական փաստի արձանագրութիւն:
Արեւմտահայերէնի հիմնադարանի ձեւաւորումը եւ անոր հիմքին վրայ առաջին հերթին արեւմտահայերէն խօսքի ճանաչման գործիքի մշակումը կ՛իրականացուի Հայաստանի մէջ սկսած Ազգային արագացման հանրային նախաձեռնութեան շրջանակին մէջ, անկախ՝ պետական-կառավարական կառոյցներէն։ Նախաձեռնութիւնը արդէն իսկ արձանագրած է լուրջ յաջողութիւններ՝ արեւելահայերէն արուեստական ձայնի «սինթեզ»ի (Text to Speech), խօսքի ճանաչման (Automatic Speech Recognition) եւ մեքենայական թարգմանութեան (Neural Machine Translation) մշակումի ոլորտներուն մէջ։
ՀՐԱՒԷՐ
Սիրելի բարեկամներ,
Լայն կիրարկութեան TTS-ի եւ STT-ի մշակումն ու գործարկումը կրթութեան եւ մշակոյթի նոր ձեւերու առանցքային գործիքներ են արհեստագիտական այս դարուն մէջ: Այս արհեստագիտութեան շնորհիւ համակարգչային թէ բջիջային յաւելուածներ, գործիքներ եւ տարբեր սարքեր պիտի կրնան իրական ժամանակի մէջ ընդօրինակել Արեւմտահայերէն ձայնային հոսքերը` անոնց գրութիւնները արտադրելու եւ անոնց հիման վրայ գործելու համար, ինչպէս նաեւ կատարեն հակառակ ուղղութեան գործողութիւնը։

Մասնակցելով այս նախաձեռնութեան, դուք կը ձեւաւորէք թուային դարաշրջանի Արեւմտահայերէնի գործիքներու մշակման համար ատաղձի ամենակարեւոր շտեմարանը՝ հիմնադարանը, դուռը լայն բանալով անոր հիմքին վրայ թափ առնելիք թուային յառաջդիմութեան առջեւ, առանց որուն արեւմտահայերէնի կենդանութիւնն ու կենսունակութիւնը դժուար պիտի ըլլայ պատկերացնել շուտով։
Իբրեւ այս գործին մասնակիցներ՝ դուք պիտի ստանաք մշակուելիք TTS եւ ASR գործիքներէն անվճար օգտուելու իրաւունք (արեւելահայերէն եւ արեւմտահայերէն տարբերակներով)։
Արեւմտահայերէն Text-to Speech շարժիչի կառուցման ուղղութեամբ արդէն կան որոշ արդիւնքներ։ Այդ մասին պատկերացում մը ստանալու համար այցելեցէք կայքէջը.
Մենք միասնաբար կրնանք արդիականացնել արեւմտահայերէնի հաղորդակցութեան եւ զարգացման միջոցները ու այդպիսով նպաստել ամբողջ աշխարհի մէջ հայ մշակոյթի յառաջդիմութեան։
Կանխապէս շնորհակալ ենք եւ կ՛ակնկալենք աշխոյժ մասնակցութիւն:
Ծրագիրին վերաբերող նորութիւններու համար այցելել Արեւմտահայերէնի թուային յառաջդիմութիւն էջը.
* Ծրագրի համակարգող
Ազգային արագացման հանրային նախաձեռնութիւն