Поддержать нас
Беларусы на войне
  1. На рынке валют перемены: доллар начал расти. Прогноз: чего ждать от курсов дальше?
  2. Олигарх, который в 2020-м выступил против насилия, после встречи с Лукашенко рассказал о новом проекте в Беларуси
  3. ЦИК Армении огласил предварительные результаты парламентских выборов
  4. Администрация Трампа сообщила Тихановской, что освобождения политзаключенных «отложены на некоторое время» — Reuters
  5. «Ты проститутка Америки и Израиля». Задержанная в Беларуси иранская студентка рассказала о 45 сутках на Окрестина и депортации
  6. Чиновники придумали очередной запрет для населения — теперь взялись за дачи. При чем тут мангалы, костры и бани
  7. Глава проблемного предприятия в Минске пожаловалась на то, как работают беларусы. Посмотрели зарплаты там — есть чему поразиться
  8. «Вопрос жизни и смерти, на операцию нужно 45 000 евро». Вот такие неудачные отпуска беларусов
  9. Тихановская и Зеленский поздравили Пашиняна с победой на выборах. Минск молчит — зато высказалась Россия
  10. «Все будет для наших граждан». Глава медвуза приветствовала отмену платного обучения — теперь россияне не будут занимать места
  11. Минздрав нашел источник инфекции у детей в Борисове и других населенных пунктах Минской области
  12. «Да простят они меня, но они обнаглевшие и хамоватые». Вышло исследование о том, что беларусы думают о себе и соседях
Чытаць па-беларуску


/

Беларусы запускаюць праект Sonora — гэта ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы, які стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дапаможа ствараць аўдыякнігі, рабіць агучку для дадаткаў і не толькі. Расказваем.

Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 
Выява носіць ілюстрацыйны характар. Ілюстрацыя: Sonora 

Падтрымаць праект можна па спасылцы.

Сёння беларуская мова амаль не прадстаўлена ў свеце галасавых і AI-тэхналогій, адзначаюць стваральнікі праекта. А без якасных дадзеных яе развіццё ў гэтым кірунку застаецца абмежаваным.

Вырашыць гэтую праблему і збіраецца Sonora — ініцыятыва па стварэнні якаснага аўдыядатасэта для беларускай мовы. Датасэт — гэта набор студыйных аўдыязапісаў, на якіх будуць навучацца мадэлі сінтэзу маўлення. Менавіта ён вызначае, як будзе гучаць мова: ці будзе яна натуральнай і жывой, або механічнай і «робатнай».

Плануецца, што такая база стане асновай для развіцця тэхналогій сінтэзу маўлення. Гэта дазволіць з’явіцца натуральнаму гучанню беларускай мовы ў сучасных тэхналогіях: дадатках, аўдыякнігах, адукацыі і AI-прадуктах.

Каманда плануе падрыхтаваць тэксты разам з лінгвістамі, якія потым агучаць прафесійныя дыктары. Потым дадзеныя апрацуюць і падрыхтуюць для далейшага выкарыстання.

На такі праект трэба 13 тысяч еўра, разлічваюць у камандзе. Каб сабраць гэтую суму, яны адкрылі збор — падтрымаць яго можна па спасылцы.