Azərbaycanda ilk dəfə səsi mətnə çevirən proqram

xəbər olan səhifəyə link:


http://gunteleqraf.az/news.php?id=21364


Rauf Fətullayev: “Telefon danışığının avtomatik tərcümə sistemini ilk dəfə biz irəli sürmüşük”

Dünyadakı dil müxtəlifliyi insanlar arasında qarşılıqlı anlaşmaya maneə yaratdığından bəşər övladının vahid dildən istifadə məsələsi bütün zamanlarda aktual olub. Amma texnologiyaların sürətlə inkişafı bu maneələri də aşmağa imkan yaradır.

Rabitə və İnformasiya Texnologiyaları naziri, akademik Əli Abbasov Azərbaycan türkcəsindən digər dillərə tərcümə və əks prosesin avtomatlaşdırılmasının ilk təşəbbüskarıdır. Azərbaycanda maşın tərcümə sisteminin yaradılması ideyasını həyata keçirmək üçün akademikin rəhbərliyi ilə 2003-cü ilin əvvəllərindən elmi tədqiqatlara başlanıb. Azərbaycan dilindən digər dillərə və əksinə tərcümə prosesini avtomatlaşdırmağa imkan verən xüsusi modelləşdirmə metodu əsasında ilk olaraq Azərbaycan-ingilis maşın tərcüməsi sistemi yaradılıb. Bu işlərin məntiqi davamı olaraq 2005-ci ilin aprel ayından isə “Dilmanc” layihəsi həyata keçirilir.

Layihədəki əsas elmi tədqiqat istiqamətləri bunlardır: dilimizdən digər dillərə və əksinə tərcümə, Azərbaycan türkcəsində nitqin tanınması (yəni səsin sözə çevrilməsi), Azərbaycan türkcəsində mətnin səsləndirilməsi (sözün səsə çevrilməsi), telefon danışığını dilimizdən digər dillərə və əksinə tərcümə edə bilən sistemlərin yaradılması.
Hazırda görülən işlər hansı səviyyədədir? Bu məqsədlə nazirliyin nəzdindəki “Azəripoçt” MMC-nin binasında yerləşən “Dilmanc” layihəsinin Proqramçılar qrupunun üzvləri ilə görüşdük.
Qrupun rəhbəri Rauf Fətullayev 2001-2002 tədris ilində Bakı Dövlət Universitetinin tətbiqi riyaziyyat fakültəsinə 672 balla daxil olub. İlk prezident təqaüdü alan gəncdən biridir. BDU-nu qırmızı diplomla başa vurub, magistraturanı bitirib, hazırda texnika elmləri namizədidir.

Rauf Fətullayev dedi ki, layihədə nəzərdə tutulmuş elmi tədqiqat istiqamətlərinin hər biri üzrə praktik nəticələr əldə olunub və hazırda onların keyfiyyətinin artırılması üzərində iş gedir. Hazırda Avropa Maşın Tərcüməsi Assosiasiyası Dilmanc layihəsini Avropa tədqiqat qrupları siyahısına daxil edib. Layihə çərçivəsində dilmanc.az saytında mətninin səsləndirilməsi - sözün səsə çevrilməsi proqramı ötən ildən tətbiq olunmağa başlayıb.

Nitqin tanınması və sintezi - səsin sözə çevrilməsi istiqamətində təkmilləşdirmə işləri davam etdirilir və yaxın aylar ərzində istifadəyə veriləcək.

Rauf Fətullayev: “Azərbaycan dili üçün nitqin tanınması sisteminin yaradılmasına 2007-ci ildən başlanıb. Bu müddətdə Azərbaycan dilinin fonem tərkibi (nitq vahidləri, səslər və s.) bir daha tədqiq edilib, sözlərin tələffüz qaydaları araşdırılaraq tələffüz bazası, nitq korpusu yaradılıb. 2500 nəfərdən çox müxtəlif yaş kateqoriyasından kişi və qadınların səsləri yazılıb. Bundan əlavə, nitqin tanınması sisteminin komponentlərindən biri olan dil modelinin qurulması üçün Azərbaycan dilinin mətn korpusu formalaşdırılıb. Bu mətn korpusunun yaradılması üçün internetdə olan Azərbaycan dilli saytların kontenti serverlərimizə köçürülüb və köçürülməkdədir. Bu kimi çoxmərhələli işlərimiz yekunlaşdıqdan sonra mikrofona deyilən sözün avtomatik olaraq mətnə çevrilməsi prosesi istifadəyə veriləcək”.

Mütəxəssis onu da bildirdi ki, nitqin tanınmasında çətinliklər və incəliklər çoxdur, çünki hər insanın nitqi fərqlidir: “Nitq sürətli, yavaş və ya dəyişən sürətli, yüksək tonlu, alçaq tonlu və ya pıçıltılı, danışıq stili aydın və ya çətin anlaşılan ola bilir. Ətrafda çox müxtəlif küylər mövcuddur. Sözlərdəki səslər arasında dəqiq sərhəd məlum deyil. Dildə sözlərin sayı həddən artıq çoxdur. Nitq zamanı sözlərdəki səslər buraxıla və ya dəyişdirilə bilir. Bu kimi problemlər gərgin elmi tədqiqatlar aparılmasını tələb edir”.

Sistemin xüsusiyyətlərindən danışan mütəxəssis dedi ki, nitqin tanınması proqramı öz-özünü təkmilləşdirdiyindən ondan daha çox istifadə olunmalıdır: “Hazırda “Dilmanc” nitqin tanınması sistemi 1 milyona yaxın söz-forma tanıya bilir. Keyfiyyətli mikrofondan istifadə edildikdə sistemin dəqiqliyi 92 faizdən artıqdır. Sistemin əsas xüsusiyyətlərinin biri də istifadə edildikcə keyfiyyətin yaxşılaşmasıdır. Proqramdan istifadə zamanı yüksək ehtimalla tapılmış cümlələr və onlara uyğun səs faylları serverə yazılır. Bu səslər vaxtaşırı nitq korpusuna əlavə edilir və sistem yenidən öyrədilir. Nitq korpusu artdıqca tanıma keyfiyyəti də yüksəlir. Ona görə də istifadəçilər çoxaldıqca, daha çox səs və söz müxtəlifliyi sistemə qeyd olunduqca, sistem o qədər təkmilləşəcək.

Qeyd edim ki, ingilis dilində bu cür bir çox sistemlər fəaliyyət göstərir. Rus dili üçün “Google” şirkəti belə bir proqram hazırlayıb. Hesab edirəm ki, yerli mütəxəssislər tərəfindən hazırlanan bu sistem də Azərbaycan üçün böyük yenilikdir. Nitqin tanınması sistemi informasiyanı - mətni kompüterə klaviaturadan istifadə etmədən birbaşa mikrofona danışmaq vasitəsiylə daxil etməyə imkan verir. Bu, həm mətni sürətlə yazmağa, həm də qurğuları səslə idarə etməyə şərait yaradır”.

Rauf Fətullayev dedi ki, insan nitqinin quruluşunun tədqiqi tarixi kifayət qədər qədim olsa da, insanların nitqi necə başa düşməsi hələ də açıq məsələ kimi qalmaqdadır: “Bu, kompüterdə nitqin tanınması sistemlərinin yaradılmasında ən əsas çətinlikdir. Heç kim insanın nitqi necə tanıması haqqında tam və dəqiq təsəvvürə malik olmadığı üçün kompüterdə nitqin tanınması üçün statistikaya əsaslanan yanaşmalar seçilib”.

Avtomatik tərcümə sistemindən danışan mütəxəssis dedi ki, bu sahədə keyfiyyətin yüksəldilməsi istiqamətində gərgin işlər görülür: “Avtomatik tərcümə insan tərcüməsinin keyfiyyətinə çatmasa da, mətni anlaşılan dilə çevirə bilir ki, bu da əksər insanların məlumat almasına imkan yaradır. Bu sistem tərcüməçilərin işini də asanlaşdırır, tərcüməçi işinə sıfırdan başlamır. Tərcümə sistemi http://www.translate.az/cgi-bin/index.cgi saytında yerləşdirlib və il ərzində bu sistemi təkmilləşdirib istifadəyə verəcəyik. Hazırda beta tərcümə kimi istifadədir”.

Bundan başqa, ingilis-Azərbaycan, rus-Azərbaycan və əksinə tərcümə sisteminin olduğunu bildirən proqramçı elektron lüğətin aktiv olduğunu dedi: “Onlayn lüğət dilmanc.az saytımızda aktivdir. İngilis-Azərbaycan istiqaməti üzrə 130 minə yaxın söz, rus-Azərbaycan istiqaməti üzrə 70-80 min söz toplanıb və getdikcə bu sistem də təkmilləşir. Burada tərcüməçilərin işini təkmilləşdirmək məqsədilə sözün hər cümlədə yerinə görə işlənməsi üçün nümunələr də verilib”.
Telefon danışığının avtomatik tərcümə sisteminin Azərbaycan tərəfindən ilk ideya olduğunu vurğulayan həmsöhbətimiz 2009-cu ildə İsveçrənin Cenevrə şəhərində beynəlxalq sərgi zamanı bu sistemin nümayişinin böyük maraq doğurduğunu söylədi: “Həmin sərginin qonaqlarından biri də BMT baş katibi Pan Gi Mun idi. O da telefon-tərcümə sistemini çox böyük maraqla qarşıladı və bizi təbrik etdi. O zaman bu sistem dünyada ilk idi, hazırda onun tətbiqi üzrə işlər gedir. Sistem özü 3 hissədən ibarətdir, nitqi tanıyıb mətnə çevirir, sonra mətni tərcümə edir və alınmış mətni səsləndirir”.

Cəmi 20 nəfər işçi heyətdən ibarət olan qrupun hazırda çətinlikləri də var. Rauf Fətullayev dedi ki, bu işə peşəkar kadrlar cəlb olunsa, proses xeyli sürətlənər: “Hazırda ən böyük problemimiz bu sahədə mütəxəssis azlığıdır. Prezidentin dövlət dilinin inkişafı ilə bağlı sərəncamının icrası istiqamətində işlərin görülməsi üçün dilçi mütəxəssislərlə əməkdaşlıq edilməlidir. Riyaziyyatçılar, proqramçılar və dil mütəxəssislərinə ehtiyacımız var. İşçi heyətimiz 20 nəfərdən ibarətdir ki, bunların da 10-u operatordur. Yaponiyada bu sahənin inkişafına milyonlarla büdcə vəsaiti ayrılır ki, bu da əhalinin maksimum sürətlə məlumatlanmasına, hər bir insanın öz sahəsində lazım olan məlumatı əldə etməsinə kömək edir”.

Sevil Hilalqızı


© dilmanc.az