Qanday qilib AI kompyuter nutqini tabiiyroq qiladi

Mundarija:

Qanday qilib AI kompyuter nutqini tabiiyroq qiladi
Qanday qilib AI kompyuter nutqini tabiiyroq qiladi
Anonim

Asosiy takliflar

  • Kompaniyalar kompyuterda yaratilgan nutqni yanada realroq qilish yoʻllarini topish uchun poygalashmoqda.
  • NVIDIA yaqinda oʻz ovozingiz bilan sunʼiy intellektni oʻrgatish imkonini beruvchi tabiiy nutq tovushini yozib oladigan vositalarni taqdim etdi.
  • Intonatsiya, hissiyot va musiqiylik kompyuter ovozlarida hali ham etishmaydigan xususiyatlar, deydi ekspert.
Image
Image

Kompyuter tomonidan yaratilgan nutq tez orada odamlarga nisbatan koʻproq eshitilishi mumkin.

Kompyuter qismlari ishlab chiqaruvchi NVIDIA yaqinda sizning ovozingiz bilan sun'iy intellektni o'rgatish imkonini beruvchi tabiiy nutq tovushini yozib oladigan vositalarni taqdim etdi. Dastur shuningdek, boshqa odamning ovozi yordamida bir ma'ruzachining so'zlarini etkazishi mumkin. Bu kompyuter nutqini yanada realroq qilish bo‘yicha jadal sur’atning bir qismidir.

"Kengaytirilgan ovozli AI texnologiyasi foydalanuvchilarga tabiiy ravishda gapirish imkonini beradi, ko'plab so'rovlarni bitta jumlada birlashtiradi va asl so'rovdagi tafsilotlarni doimiy ravishda takrorlash zaruratini yo'q qiladi ", - Maykl Zagorsek, SoundHound nutqni aniqlash kompaniyasining bosh operatsion direktori, dedi Lifewire’ga elektron pochta orqali bergan intervyusida.

"Ko'pgina ovozli AI platformalarida mavjud bo'lgan bir nechta tillarning qo'shilishi raqamli ovozli yordamchilarni ko'proq geografiyalarda va ko'proq aholi uchun foydalanish imkonini beradi", deb qo'shimcha qildi u.

Robonutq koʻtarilmoqda

Amazon’ning Alexa va Apple’ning Siri’lari hatto o‘n yil avvalgi kompyuter nutqidan ham yaxshiroq eshitiladi, ammo ular yaqin orada haqiqiy inson ovozi bilan adashmaydi.

Suniy nutq tovushini tabiiyroq qilish uchun NVIDIA’ning matndan nutqqa tadqiqot guruhi RAD-TTS modelini ishlab chiqdi. Tizim odamlarga matndan nutqqa (TTS) oʻz ovozi, jumladan, pacing, ohang, tembr va boshqa omillarni oʻrgatish imkonini beradi.

Kompaniya oʻzining yangi modelidan oʻzining “I Am AI” video seriyasi uchun koʻproq suhbatdoshli ovozli hikoya yaratish uchun foydalandi.

"Ushbu interfeys yordamida video prodyuserimiz video stsenariyni oʻqiyotganini yozib olishi va soʻngra sunʼiy intellekt modeli yordamida nutqini ayol hikoyachining ovoziga aylantirishi mumkin edi. Ushbu asosiy hikoyadan foydalanib, prodyuser soʻngi sunʼiy intellektni xuddi shunday yoʻn altirishi mumkin edi. ovozli aktyor - aniq so'zlarni ta'kidlash uchun sintezlangan nutqni sozlash va video ohangini yaxshiroq ifodalash uchun rivoyat tezligini o'zgartirish ", deb yozdi NVIDIA o'z veb-saytida.

Ovozdan ham qiyinroq

Kompyuter tomonidan yaratilgan nutqni tabiiy qilish qiyin muammo, deydi mutaxassislar.

“Uning kompyuter versiyasini yaratish uchun siz birovning yuzlab soatlik ovozini yozib olishingiz kerak”, dedi Kukarella matndan nutqqa dasturiy taʼminot kompaniyasi bosh direktori Nozim Ragimov Lifewire’ga elektron pochta orqali bergan intervyusida. “Yozuv yuqori sifatli, professional studiyada yozilgan bo‘lishi kerak. Qanchalik koʻp soatlik sifatli nutq yuklansa va qayta ishlansa, natija shunchalik yaxshi boʻladi."

Matndan nutqqa oʻyin oʻynashda, vokal nuqsonlari boʻlgan shaxslarga yordam berish yoki foydalanuvchilarga oʻz ovozi bilan tillar oʻrtasida tarjima qilishda foydalanish mumkin.

Intonatsiya, hissiyot va musiqiylik kompyuter ovozlarida hali ham yetishmaydigan xususiyatlar, deydi Ragimov.

Agar sun'iy intellekt ushbu etishmayotgan havolalarni qo'shsa, kompyuter tomonidan yaratilgan nutq "haqiqiy aktyorlarning ovozidan farq qilib bo'lmaydi", deya qo'shimcha qildi u. "Bu ish davom etmoqda. Boshqa ovozlar radio boshlovchilari bilan raqobatlasha oladi. Tez orada siz qoʻshiq aytish va audiokitoblarni oʻqiy oladigan ovozlarni koʻrasiz."

Nutq texnologiyasi keng doiradagi biznesda ommalashmoqda.

"Avtosanoat yaqinda xavfsizroq va bog'langan haydash tajribasini yaratish usuli sifatida ovozli AIni qo'llagan", dedi Zagorsek.

"O'shandan beri brendlar mijozlar tajribasini yaxshilash yo'llarini izlash va o'z mahsulotlari va xizmatlari bilan o'zaro aloqada bo'lishning osonroq, xavfsizroq, qulayroq, samarali va gigienik usullariga bo'lgan talabni qondirish yo'llarini izlayotgani sababli ovozli yordamchilar tobora keng tarqalmoqda."

Odatda, ovozli sun'iy intellekt ikki bosqichli jarayonda so'rovlarni javoblarga o'zgartiradi, bu avtomatik nutqni aniqlash (ASR) yordamida nutqni matnga transkripsiya qilish va keyin ushbu matnni tabiiy tilni tushunish (NLU) modeliga o'tkazishdan boshlanadi.

Image
Image

SoundHound yondashuvi nutqni real vaqtda kuzatish uchun ushbu ikki bosqichni bir jarayonga birlashtiradi. Kompaniyaning taʼkidlashicha, bu usul ovozli yordamchilarga foydalanuvchi soʻrovlarining maʼnosini hatto odam gapirib boʻlmay turib ham tushunish imkonini beradi.

Kompyuter nutqidagi kelajakdagi yutuqlar, jumladan, faqat oʻrnatilgan (bulutga ulanish shart emas)dan gibrid (koʻmilgan plus bulut) va faqat bulutga qadar turli xil ulanish imkoniyatlari mavjudligi turli sohalardagi kompaniyalarga koʻproq tanlov imkonini beradi. xarajat, maxfiylik va qayta ishlash quvvati mavjudligi nuqtai nazaridan, dedi Zagoresk.

NVIDIA ta'kidlashicha, uning yangi AI modellari ovozli ishlashdan tashqarida.

“Matndan nutqqa oʻyin oʻyinlarida, vokal nuqsonlari boʻlgan shaxslarga yordam berish yoki foydalanuvchilarga oʻz ovozida tillar oʻrtasida tarjima qilishda yordam berish uchun foydalanish mumkin”, - deb yozadi kompaniya. "U nafaqat qo'shiqning ohangiga, balki vokal ortidagi hissiy ifodaga ham mos keladigan taniqli qo'shiqchilarning chiqishlarini qayta yaratishi mumkin."

Tavsiya: