Հանրային Նախաձեռնութիւն Ի Խնդիր Թուային Յառաջդիմութեան.- ՍԿՍԱԾ Է ԱՐԵՒՄՏԱՀԱՅԵՐԷՆ TTS ԵՒ STT ԳՈՐԾԻՔՆԵՐՈՒՆ ԿԱՌՈՒՑՈՒՄԸ

0 0
Read Time:4 Minute, 6 Second

Սկսած է արեւմտահայերէն խօսքի ճանաչման (Automated Speech Recognition կամ Speech-to-Text) եւ խօսքի սինեթզի (Text-to-Speech) շարժիչներուն կառուցումը, որուն մասնակցելու հրաւիրուած են արեւմտահայերէն խօսող մարդիկ առանց որեւէ խտրութեան։

Այս շարժիչները չափազանց մեծ կարեւորութիւն պիտի ունենան մեր ապրած թուային դարաշրջանին մէջ արեւմտահայերէնի կենսունակութեան, օգտագործման եւ տարածման համար եւ կոչուած են ըլլալու շատ կարեւոր իրագործումներ անոր թուային յառաջդիմութեան մէջ։

STT ինչ է այն

Automated Speech Recognition (ARS) կամ Speech-to-Text (STT) շարժիչները համակարգչային ծրագիր-գործիքներ են, որոնք հնարաւորութիւն կու տան ճանչնալու որեւէ լեզուի բանաւոր խօսքը եւ զայն “կը թարգմանեն”, կը վերածեն թեքսթի՝ համակարգչային լեզուագիտութեան միջոցով։ Համաշխարհային փորձառութեան մէջ STT-ը առաւելաբար կը կիրարկուի բանաւոր խօսքի միջոցով պետական, առեւտրական, ֆինանսական, առողջապահական, մշակութային եւ հանրային այլ կառոյցներու հետ մարդոց յարաբերութիւնները ինքնագործ դարձնելուն մէջ։

TTS ինչ է այն

Ձայնի սինթեզի (TTS) շարժիչը ելեկտրոնային թեքսթերը կը վերափոխէ դիւրութեամբ հասկնալի ձայնային հաղորդագրութեան: TTS-ը կրնայ օգտագործուիլ կայքէջերու յօդուածներ, հեռախօսի վրայ ստացուած նամակներ, գիրքեր եւ ուսուցողական նիւթեր կարդալու համար: Անիկա շատ պիտանի գործիք մըն է տեսողական խնդիրներ ունեցող, տարեց կամ գրաճանաչութեան հետ կապուած դժուարութիւններ ունեցող մարդոց համար։

Աշխարհը եւ մենք

Այս արհեստագիտութեան մէջ հսկայական յառաջդիմութիւն արձանագրուած է աշխարհի մեծ թէ փոքր գրեթէ բոլոր լեզուներուն մէջ․ ժամանակն է, որ արեւմտահայերէնը միանայ անոնց։

Արեւմտահայերէնի պարագային, այս գործիքներուն նշանակութիւնը մեծ է յատկապէս կրթութեան, ստեղծագործական գործունէութեան, մշակութային ժառանգութեան պահպանման եւ փոխանցման , ուսման եւ ժամանցի ոլոտներուն մէջ։

Հիմնադարանը

Արեւմտահայերէնին համար թուային այս եւ այլ գործիքներ մշակելու նպատակով անհրաժեշտ է ձեւաւորել արեւմտահայերէնի բանաւոր եւ գրաւոր խօսքի գորբուս՝ հիմնադարան ․ աշխատանք մը, որ կրնայ իրականանալ մասնակցութեամբը արեւմտահայերէն խօսող 80-140 տարբեր մարդոց, որոնք պէտք է կատարեն որոշակի ծաւալի արեւմտահայերէն թեքսթերու ձայնագրութիւններ։

Հիմնադարանը ըստ էութեան բանաւոր եւ գրաւոր խօսքի անհրաժեշտ այն Data կեդրոնն է, առանց որուն խօսք անգամ չի կրնար ըլլալ TTS- ի, STT-ի եւ այդ շրջանակի թուային այլ գործիքներու կառուցման մասին։

Կամաւորներ կոչուած են ձեւաւորելու թուային դարաշրջանի արեւմտահայերէնի գործիքներու մշակման համար անհրաժեշտ գրա-ձայնային ատաղձի շտեմարանը եւ այդ  հիմքին վրայ մասնակցելու արեւմտահայերէնի TTS եւ STT առաջին շարժիչներու կառուցման։

ԻՆՉՊԷՍ ՄԱՍՆԱԿՑԻԼ ՁԱՅՆԱԳՐԵԼ

Հիմնադարանը ձեւաւորելու համար, ընդամէնը անհրաժեշտ է մուտք գործել հետեւեալ կայքը՝ https://arm.ican24.net/hyw , ընտրել որեւէ թեքսթ եւ  ձայնագրել զայն համակարգիչի կամ բջիջային հեռախօսի օգնութեամբ: Միջինը կը պահանջուի 15֊20 վայրկեան: Եթէ տարբեր պատճառներով չկարենաք կամ չհասցուցիք ձայնագրել ամբողջ թեքսթը մէկ անգամով, կրնաք ատիկա ընել աւելի ուշ․ համակարգը պիտի «ճանչնայ» ձեզ։ Անիկա պիտի պահպանէ նաեւ բոլոր այն մասնակի կամ ամբողջական ձայնագրութիւնները, որոնք դուք կրցած էիք վերբեռնել (upload) նախորդ անգամներուն:

Թեքսթերը

Որպէս սկիզբ, ձայնագրութեան համար մեր կայքին մէջ տեղադրուած են մօտ 160 տարբեր թեքսթ-պարբերութիւններ, առնուած պոլսահայ-ֆրանսահայ անուանի հրապարագիր Շաւարշ Միսաքեանի գրութիւններէն։ Ընտրութիւնը կատարուած է միայն ու միայն հաշուի առնելով Միսաքեանի լեզուին յատկութիւնները՝ դասական, կուռ եւ պարզ։ Հետագային համալրում պիտի կատարուի այլ հեղինակներէ։ Եթէ դուք կը նախընտրէք ձայնագրել ձեր սեփական թեքսթերը, ապա կրնաք ընել ատիկա կայքին մէջ, ուր կայ համապատասխան բաժին մը ատոր համար։ Նոյն տեղը կրնաք վերբեռնել ձեր մօտ եղած այլ ձայնագրութիւններ, անոնց թեքսթերով։

Նշաձողը

Ծրագիրին կատարման համար տարբեր ձայնագրողներու նուազագոյն շեմը 80-ն է․ 140 տարբեր ձայնագրողներու պարագային, խօսքին ճանաչումը մօտիկ կ՛ըլլայ կատարեալին, իսկ աւելին արդէն կ՛ապահովէ միանշանակ ճանաչում բոլոր պարագաներուն: Ընդհանուրը, կարիքը կայ մօտ 500 ժամ ձայնագրութեան՝ լաւագոյն արդիւնքին համար։

ՊԱՏՄԱԿԱՆ ԳՐԱՆՑՈՒՄ

Ձայնագրութիւններուն կատարման համար կայքին մէջ գրանցումը անհրաժեշտ է մասնակիցներու նոյնականացման (identification) համար: Մասնակիցներուն անուն֊ազգանունները պիտի գրուին արեւմտահայերէն խօսքի ճանաչման առաջին գործիքը մշակողներու ցուցակին մէջ՝ որպէս պատմական փաստի արձանագրութիւն:

Կազմակերպութիւնը

Արեւմտահայերէնի հիմնադարանին ձեւաւորումը եւ անոր հիմքին վրայ առաջին հերթին արեւմտահայերէն խօսքի ճանաչման գործիքին մշակումը կ՛իրականացուի Հայաստանի մէջ սկսած Ազգային արագացման հանրային նախաձեռնութեան շրջանակին մէջ, անկախ՝ պետական-կառավարական կառոյցներէն։ Նախաձեռնութիւնը արդէն իսկ արձանագրած է լուրջ յաջողութիւններ՝ արեւելահայերէն արուեստական ձայնի սինթեզի (Text to Speech), խօսքի ճանաչման (Automatic Speech Recognition) եւ մեքենայական թարգմանութեան (Neural Machine Translation) մշակումի ոլորտներուն մէջ։

Հրաւէր

Սիրելի բարեկամներ,

Լայն կիրարկութեան TTS-ի եւ STT-ի մշակումն ու գործարկումը կրթութեան եւ մշակոյթի նոր ձեւերու առանցքային գործիքներ են արհեստագիտական այս դարուն մէջ: Այս արհեստագիտութեան շնորհիւ համակարգչային թէ բջիջային յաւելուածներ, գործիքներ եւ տարբեր սարքեր պիտի կրնան իրական ժամանակի մէջ ընդօրինակել Արեւմտահայերէն ձայնային հոսքերը` անոնց թեքսթերը արտադրելու եւ անոնց հիման վրայ գործելու համար, ինչպէս նաեւ կատարեն հակառակ ուղղութեան գործողութիւնը՝ մեծ ճշգրտութեամբ թեքսթերու ձայնային «թարգմանութիւնը»։

Մասնակցելով այս նախաձեռնութեան, դուք կը ձեւաւորէք թուային դարաշրջանի Արեւմտահայերէնի գործիքներու մշակման համար ատաղձի ամենակարեւոր եւ անփոխարինելի շտեմարանը՝ հիմնադարանը, դուռը լայն բանալով անոր հիմքին վրայ թափ առնելիք թուային յառաջդիմութեան առջեւ, առանց որուն արեւմտահայերէնի կենդանութիւնն ու կենսունակութիւնը դժուար պիտի ըլլայ պատկերացնել շուտով։

Որպէս այս գործին մասնակիցներ, դուք պիտի ստանաք մշակուելիք TTS եւ ASR գործիքներէն անվճար օգտուելու իրաւունք (արեւելահայերէն եւ արեւմտահայերէն տարբերակներով) ։ Ձեր նշած ելեկտրոնային հասցէներով պիտի ուղարկուին համապատասխան ցուցումներ, թէ ինչպէս կրնաք օգտուիլ այդ գործիքներէն, անոնց լիակատար պատրաստութենէն յետոյ:

Արեւմտահայերէն Text-to Speech շարժիչին կառուցման ուղղութեամբ արդէն կան որոշակի արդիւնքներ։ Այդ մասին պատկերացում մը ստանալու համար այցելեցէք՝ https://www.facebook.com/westernarmenian.digital/posts/106635928637102

Մենք միասնաբար կրնանք արդիականացնել արեւմտահայ լեզուի հաղորդակցութեան եւ զարգացման միջոցները եւ այդպիսով նպաստել ամբողջ աշխարհի մէջ հայ մշակոյթի յառաջդիմութեան։

Շնորհակալ ենք եւ կ՛ակնկալենք աշխոյժ մասնակցութիւն:

 

Վարդան Թաշճեան

Ծրագրի համակարգող

Ազգային արագացման հանրային նախաձեռնութիւն

26 Փետրուար, 2022

 

Ծրագրին վերաբերող նորութիւններուն համար այցելել

FB Արեւմտահայերէնի թուային յառաջդիմութիւն էջը՝

www.facebook.com/westernarmenian.digital/

 

 

 

Happy
Happy
0 %
Sad
Sad
0 %
Excited
Excited
0 %
Sleepy
Sleepy
0 %
Angry
Angry
0 %
Surprise
Surprise
0 %

Average Rating

5 Star
0%
4 Star
0%
3 Star
0%
2 Star
0%
1 Star
0%

Leave a Reply

Your email address will not be published.

Social profiles