پردازش گفتار

سرویس‌های پردازش گفتار به استخراج اطلاعات از داده‌های صوتی می‌پردازند و همگام با فهم، پردازش و دسته‌بندی آن‌ها، امکان استخراج اطلاعاتی چون احساس، جنسیت، سن، میزان هشیاری یا خواب‌آلودگی و تشخیص هویت از داده‌های صوتی را نیز میسر می‌سازند. پردازش گفتار در محدوده‌ی وسیعی از کاربردها مورد استفاده قرار می‌گیرد که برخی از آن‌ها شامل تبدیل داده‌های صوت به متن قابل ویرایش، تبدیل متن به صوت و احراز هویت از طریق صوت می‌شود. این سرویس‌ها با تکیه بر دانش متخصصین هوش مصنوعی و مبتنی بر آخرین تکنولوژی‌های روز دنیا تولید شده‌ و دارای سرعت و ضریب دقت بالایی می‌باشند.

سنتز صوت

سرویس‌های گروه سنتز صوت با هدف پاسخگویی به توانایی تکلم و انتقال اطلاعات از طریق گفتار برای ارتباط بین انسان و ماشین توسعه داده شده‌اند. به عنوان مثال با داشتن متن می‌توان محتوای صوتی متناظر را داشت، احساس دلخواه را به آن افزود و یا نوع بیان جمله اعم از خبری، تعجبی و ... را مشخص کرد. حتی می‌توان احساس و نوع بیان صوت را با توجه به نیاز تغییر داد..

پیش‌پردازش

یکی از زمینه‌های اصلی در حوزه پردازش صوت، پیش‌پردازش است که موجب کاهش بار محاسباتی و همچنین بهبود عملکرد سیستم‌های مبتنی بر صوت می‌شود. به عنوان مثال به کمک این سرویس‌ها می‌توان فقط قسمت‌هایی از صوت را که حاوی گفتار هستند به‌جای تمام صوت به سیستم بازشناسی جهت استخراج متن موردنظر داد یا اینکه نویز موجود در صوت را که می‌تواند مخل عملکرد و آزاردهنده باشد را کاهش داد.

بازشناسی

استخراج محتوای متنی از صوت از قدیمی‌ترین و چالش‌برانگیزترین مسائل حوزه پردازش گفتار به شمار می‌رود. با تکیه بر این توانایی ماشین‌ها قادر به درک کلمات و عبارات در صوت خواهند بود و فایل‌های صوتی قابل جستجو می‌گردند. همچنین سرویس‌های این گروه در سرویس‌های پیشرفته‌تر مبتنی بر صوت چون دستیار‌های صوتی اهمیت بسزایی دارند. تبدیل صوت به متن و تشخیص کلیدواژه از سرویس‌های این گروه به شمار می‌روند.