Беларуская мова ў тэхналогіях
Sonora - праект беларускай супольнасці
Мы ствараем першы беларускі тэхналагічны голас
Паслухайце, як гучыць беларуская мова ў тэхналогіях сёння
Звярніце ўвагу на націскі, амографы і фанетыку.
Голас ад OpenAI
Голас ад ElevenLabs.io
Голас ад праекта TuteishyGPT
ШІ песня ад suno.com
А вось як гэта мусіць гучаць
Рэферэнснае гучанне
Мы ствараем студыйны беларускамоўны датасэт для TTS, каб мадэлі правільна ставілі націскі і гучалі натуральна па-беларуску. Ваш унёсак — практычны крок да таго, каб беларуская мова ўпэўнена жыла ў аўдыякнігах, адукацыі, медыя, праграмах і сэрвісах.
Без якаснага датасэту не будзе якаснага голас ў тэхналогіях
Сёння ў свеце амаль не існуе якасных беларускамоўных галасавых датасэтаў, спецыяльна запісаных для навучання сучасных TTS-мадэляў.
Амографы: маленькая дэталь, якая ламае сэнс
У беларускай мове тысячы амографаў: аднолькавае напісанне, але розны сэнс у залежнасці ад націску. Калі мадэль памыляецца з націскам, ламаецца і гучанне, і сэнс.
Фанетыка
Другая праблема — фанетычная карэктнасць: мяккасць, “ў”, “дз/дж”, інтанацыя і рытм. Без якаснага студыйнага матэрыялу мадэлі паўтараюць памылкі і гучаць менш натуральна.
Рашэнне Sonora: студыйны датасэт з фокусам на амографах і фанетыцы
Мы запускаем супольнае фінансаванне, каб арганізаваць прафесійны студыйны запіс беларускага маўлення на спецыяльна падабраных тэкстах.
Адкрыта для ўсіх
Датасэт будзе публічны і з адкрытай ліцэнзіяй.
- Карыстацца змогуць даследчыкі, энтузіясты, стартапы і адукацыйныя ініцыятывы.
- Кампаніі з беларускамоўным TTS змогуць палепшыць якасць сваіх мадэляў.
- Паралельна мы развіваем і ўласную мадэль, каб не залежаць ад рашэнняў BigTech.
Мы плануем партнёрствы з Google, OpenAI і ElevenLabs, каб наш датасэт узмацніў іх рашэнні для беларусаў.
Працягваем добрую справу
Мы ўдзячныя праекту Donar.by за закладзеную аснову: сабраныя матэрыялы ўжо дапамаглі ў навучанні беларускай мадэлі BexTTS. Sonora працягвае гэты шлях і выводзіць яго на студыйны ўзровень.
Існуючая ініцыятыва: Donar.by
Існуючая беларуская мадэль: BexTTS
Чаму гэта важна
Беларуская мова павінна гучаць у штодзённым жыцці. Вось 7 ключавых сцэнароў, дзе беларускі TTS змяняе правілы.
Даступнасць і інклюзія
Людзі з парушэннямі зроку або дыслексіяй атрымаюць доступ да беларускамоўных тэкстаў.
Аўдыякнігі і падкасты
Агучванне артыкулаў, кніг і апавяданняў без вялікіх бюджэтаў. Больш кантэнту — хутчэй і танней.
Адукацыя
Школьнікі і студэнты змогуць слухаць падручнікі і тлумачэнні. Настаўнікі змогуць ствараць матэрыялы хутчэй.
ІТ-прадукты і стартапы
Галасавыя памочнікі, чат-боты, навігатары, інтэрфейсы і гіды — усё па-беларуску.
Мова ў лічбавым свеце
TTS — адзін з ключавых кампанентаў для маўленчых тэхналогій (у тым ліку STT), адукацыйных мадэляў і інструментаў для журналістаў і стваральнікаў кантэнту.
Дыяспара
Беларусы за мяжой атрымаюць доступ да мовы праз аўдыё і змогуць вучыць ёй дзяцей.
Што мы створым на першым этапе
- Студыйны запіс з кантраляванай якасцю гуку
- Прафесійная дыкцыя і стабільная манера чытання
- Тэксты, спецыяльна падабраныя пад TTS (баланс гукаў і спалучэнняў)
- Асобны фокус на амографах: шмат кантэкстаў, дзе мадэль вучыцца ставіць націск
- Фанетычная карэктнасць: беларускае гучанне як норма
- Дакументацыя: што ўваходзіць у датасэт і як яго выкарыстоўваць
- Адкрытая ліцэнзія для выкарыстання ў распрацоўцы і даследаваннях
Этапы праекта
Фандрайзінг
Збор сродкаў і падтрымкі ад дыяспары і супольнасці.
Мы зараз на гэтым этапе
Падрыхтоўка тэкстаў для начыткі
Адбор збалансаваных тэкстаў спецыялістамі-лінгвістамі.
Запіс у студыі гуказапісу
Прафесійны дыктарскі запіс
Постапрацоўка
Нармалізацыя, разметка і падрыхтоўка датасэту для публічнага рэлізу.
Публічны рэліз датасэту
Публічны даступ да датасэту для супольнасці і бізнесу.
Бюджэт і мэта збору
Фінансавая мэта этапу
Структура бюджэту
- Студыя (арэнда, запіс)
- Ганарар дыктару
- Гукарэжысёр / інжынер запісу
- Апрацоўка, нарэзка, QC
- Падбор тэкстаў / лінгвістычная праца
- Адміністрацыйныя выдаткі non-profit
- Камісіі плацежных сістэм
- Рэзерв (5–10%)
Вылічальныя рэсурсы на навучанне ШІ-мадэляў стануць наступным асобным этапам.
Незалежнасць праекта
Sonora — гэта незалежная ініцыятыва, не афіляваная ні з якімі палітычнымі структурамі, партыямі, фондамі ці арганізацыямі. Мы працуем выключна з матывацыі сацыяльна-культурнай каштоўнасці: падтрымка, захаванне і развіццё беларускай мовы ў сучасных тэхналогіях.
Каманда
Мы — валанцёрская каманда, якая ўжо працуе над праектам і нясе адказнасць за вынік. Частка ўдзельнікаў пазначана публічна, частка — ананімна па меркаваннях бяспекі.
Ганна Маклакова
Праектная менеджарка
Уладзіслаў
Інжынер-лінгвіст
TuteishyGPT
Каманда AI-інжынераў
Арцём Канцавы
Заснавальнік dev.by
FAQ
Ці гэта камерцыйны праект?
Не. Гэта некамерцыйная ініцыятыва супольнасці з культурна-сацыяльнай мэтай.
Куды пойдуць грошы?
На студыйны датасэт і работы, пазначаныя ў бюджэце. Усе паступленні і выдаткі будуць адлюстраваны ў справаздачнасці.
Ці будзе датасэт адкрыты?
Так. Мы публікуем датасэт з адкрытай ліцэнзіяй і дакументацыяй.
Ці палепшыце вы “сваю мадэль”?
Так. Мы працягваем развіваць існуючую беларускую мадэль BexTTS (навучанне на новым студыйным датасэце) і, пры патрэбе, адаптуем іншыя мадэлі.
Ці атрымаюць датасэт вялікія кампаніі?
Мы прапануем датасэт усім зацікаўленым, у тым ліку кампаніям з беларускамоўным TTS. Але мы не залежым ад іх рашэнняў.
Чаму галоўны фокус — амографы?
Бо памылкі ў націсках найчасцей ламаюць сэнс і давер да агучкі.
Што будзе, калі не атрымаецца сабраць поўную суму?
Нават калі не ўдасца сабраць поўную суму, мы пачнем студыйны запіс адразу пасля першага фінансавання. Кожнае запісанае слова — гэта ўклад у якасць беларускага TTS, таму колькі б мы ні запісалі, усё пойдзе на карысць.
Падтрымаць Sonora
Кожны данат — гэта гадзіны студыйнага запісу, большы датасэт і лепшая якасць беларускага голасу. Дзякуй, што робіце гэта магчымым.
- Падтрымка ідзе праз некамерцыйную арганізацыю Sonora Fondas.
- Фінансавая мэта бягучага этапу — 13 000 €.
- Структура бюджэту і дэталі адкрыта апублікаваныя.
Альбо падтрымаць наўпрост на рахунак Sonora Fondas
VšĮ "Sonora Fondas"
Company code: 307494138
Vilnius, J. Jasinskio g. 4-23 LT-01112
„Swedbank”, AB
SWIFT code: HABALT22
Legal entity code: 112029651
IBAN: LT807300010198568480