آزمایشگاه پردازش هوشمند دادههای چند رسانهای (آزمایشگاه پردازش هوشمند دادههای صوتی-گفتاری سابق)، در سال 1375 تاسیس یافته است.
امروزه نیاز به تحقیقات برای توسعه تکنیکهای پردازش دادههای چندرسانهای بسیار مهم و ضروری است. ماموریت این آزمایشگاه توسعه الگوریتمهای پیشرفته برای پردازش دادههای چندرسانهای و توسعه سیستمای چندرسانهای هوشمند است.
دانش و تجربیات فراهم شده در طی حدود 20 سال از تاسیس این آزمایشگاه، امکان توسعه سیستمهای چندرسانهای با استفاده از دانشها و تکنیکهای در حد مرزهای دانش را فراهم نموده است. این آزمایشگاه در زمینه کاری خود از جمله آزمایشگاههای پیشتاز در دانشگاههای کشور در زمینه پردازش سیگنالها خصوص پردازش صوت و گفتار و نیز متن میباشد.
پروژهها و فعالیتها:
- · انجام پروژههای دانشجویی اعم از کارشناسی، کارشناسی ارشد و دکتری
- · انجام پروژههای تحقیقاتی و طرحهای ملی و مستقل
- انجام پروژههای صنعتی
بعضي از پروژههاي کارشناسی ارشد و دکتری انجام شده و يا در حال انجام عبارتند از:
- آوانويسي و مرزبندي زماني پايگاههاي داده گفتار فارس
- بازشناسي اتوماتيك بعضي از زبانهاي رايج در ايران به كمك روشهاي آماري
- تصديق هويت گوينده با استفاده از شبكههاي عصبي و الگوريتمهاي ژنتيكي
- طراحي و ساخت سيستم تبديل متن به واج براي زبان فارسي
- تشخيص گفتاري شماره شناسايي شخصي
- تائيد هويت گوينده بصورت مستقل از متن: مدل كردن كوينده ها، محيطهاي غير متعارف، تصميمگيري
- تعيين هويت گوينده روي شبكه اينترنت
- طراحي و پياده سازي سيستم توليد گفتار فارسي با تاكيد بر بهبود هرچه بيشتر كيفيت گفتار توليد شده
- بازشناسي اعداد پيوسته فارسي مستقل از گوينده
- تقطيع گفتار فارسي به واحدهاي واكدار- بيواك، هجا و واج
- عيب يابي موتورهاي دوار به روش آناليز ارتعاشات
- شناسائي كلمات كليدي در گفتار پيوسته فارسي
- بازشناسي گفتار پيوسته فارسي
- تعيين هويت گوينده مجموعه باز: برسي روش هاي افزايش سرعت و دقت
- تعيين هويت گوينده در شرائط غير متعارف: ارزيابي روشها و ارائه دستورالعملهاي مناسب
- تخمين پارامترهاي سنتز گفتار فارسي با استفاده از تكنيكهاي يادگيري
- بررسي مسائل زبان طبيعي براي يک سيستم تبديل متن به گفتار فارسي
- ارزيابي تاثير روشهاي انتقال و فشرده سازي گفتار در شبکههاي کامپيوتري بر کارايي سيستمهاي بازشناسي گوينده
- مدلسازي تغييرات زيروبمي، كشش و شدت گفتار در زبان فارسي ( بكار گيري در سنتزگفتار فارسي)
- بهبود راندمان سيستمهاي تصديق هويت گوينده با استفاده از اطلاعات مفهومي گفتار
- نشانهگذاري گفتار چندين گوينده در مدارك و مستندات گفتاري
- طراحي و ساخت وكدر گفتار با ترخ بيت بسيار پايين با استفاده از روشهاي شناسايي و سنتز گفتار
- توليد و انتخاب واحد سنتز و ايجاد واحدهاي سنتز ناموجود براي سنتز گفتار فارسي
- استفاده از فناوري پردازش گفتار در آموزش زبان خارجي به كمك كامپيوتر
- تشخيص نفوذ با استفاده از مدل مخلوط گوسي و مقايسه و تركيب آن با ماشين بردار پشتيبان
- ارائه پردازش اوليه مناسب براي مقاوم سازي سيستم هاي بازشناسي خودكار گفتار (دکتري استاد مشاور)
- تشخيص هويت با استفاده از گفتار و مدل ماهيچههاي مولد حركات (دکتري استاد مشاور)
- مقاومسازي بازشناسي گفتار در محيط با نويز ناهمبسته با استفاده از پردازش چندين باندي (دکتري استاد مشاور)
- پيادهسازي و بهبود عملکرد کدکنندههاي با نرخ پائين و بسيار پائين
- مقاومسازي سيستم هاي بازشناسي گفتار و گوينده در مقابل نويزهاي جمع شونده و نويز کانال
- تشخيص محل کسره اضافه در متون فارسي جهت استفاده در تبديل متن به گفتار
- مقايسه و انتخاب روشهاي مناسب مبتني بر دانش و پيکره براي تحليل معنايي در سيستم هاي تبديل متن به گفتار فارسي
- ارائه شيوه انطباق تکنيکهاي واقعيت مجازي در تجارت الکترونيکي
- ارزيابي کيفيت صوت در شبکه هاي مبتني بر IP با استفاده از پارامترهاي کيفيت سرويس شبکه
- ارائه و ارزيابي يک سيستم تشخيص نفوذ به شبکههاي کامپيوتري مبتني بر روشهاي تشخيص جرم در جوامع انساني
- بهبود مدل اکوستيکي گفتار مبتني بر مدل پنهان مارکوف (دکتری)
- تطبيق مدل در بازشناسي گفتار و گوينده با استفاده از الگوريتم ژنتيک و آموزش تطبيقي خوشهها
- مدل کردن نواي گفتار با استفاده از روشهاي دادهگرا و قانونگرا
- بازشناسي گوينده، مبتني بر همجوشي و فضاي حالت ساخته شده از گويندگان ويژه.
- مقاومسازي سيستمهاي بازشناسي گفتار و گوينده
- تشخيص محل کسره اضافه در متون فارسي جهت استفاده در تبديل متن به گفتار
- مقايسه و انتخاب روشهاي مناسب مبتني بر دانش و پيکره براي تحليل معنايي در سيستمهاي تبديل متن به گفتار فارسي
- ارائه و ارزيابي يک سيستم تشخيص نفوذ به شبکههاي کامپيوتري مبتني برروشهاي تشخيص جرم در جوامع انساني
- پيادهسازي و بهبود عملکرد کدکننده هاي با نرخ بيت پائين و بسيار پائين
- بهبود بازشناسي کلمات کليدي و بکارگيري آن در دسترسي صوتي به خدمات تلفني
- ارائه روشهايي جهت بهبود کارائي در تشخيص صوتي زبان
- شاخصگذاري گوينده مبتني بر مدل ميدانهاي تصادفي شرطي (دکتری)
- بهبود کارايي سيستمهاي بازشناسي گوينده با استفاده از شبکه هاي بيزي پويا (دکتری)
- بکارگيري برنامه نويسي ژنتيک در بهبود کارايي سيستمهاي بازشناسي گوينده
- سنتز گفتار مبتنی بر روش انتخاب واحد از دادگانهای بزرگ، تعیین توابع هزینه، پیرایش دادگان و بهبود گفتار در محل اتصال واحدها
- تعيين محدوده سني و زن و مرد بودن گوينده در نمايهسازي فايلهاي صوتي
- طراحي و پيادهسازي سیستم ترجمه گفتار به گفتار فارسی-انگلیسی با دامنه محدود
- نمايه سازي اسناد صوتي به گفتار، موسيقي، سکوت و نويزهاي زمينه
- بهبود تشخيص خودکار زبان گفتاری بر مبنای اطلاعات اکوستيکی
- بهبود روشهای واحدسازی و نرمالسازی متون در زبان فارسی
- تبديل نويسه به صدا در زبان فارسی با استفاده از ويژگيهاي املائی و آوايي زبان فارسی
- رفع ابهام از کلمات همنویسه فارسی به کمک شبکه معنایی کلمات و گنجواژه
- تشخیص واحدهای اسمی مبتنی بر خصوصیات آنها در متون فارسی
- آنالیز نوع و مشخصات مدولاسیون دادههای دیجیتال با استفاده از روشهای پردازش رقمی سیگنالها و تکنیکهای هوشمند
- شناسایی مقاوم نوع مدولاسیون و پارامترهای آن بصورت خودکار با استفاده از ابر بردارها
- تبدیل صدای مستقل از متن
- پیادهسازی و بهینهسازی الگوریتمهای بازشناسی گفتار و گوینده بر روی سختافزارهای با امکانات پردازشی محدود
- بازشناسی گفتار محاورهای-فیالبداهه و تبدیل آن به گفتار رسمی-خواندنی
- بهبود کارایی واسط مغز-رایانه از نقطه نظر سرعت و دقت
- شناسایی و استخراج سیگنالهای چندحامله؛ همسان سازی آنها و استخراج سمبولهای مدوله شده
- استفاده از روشهای نیمهنظارتی در خلاصهسازی استخراجی گفتار
- آموزش نحوه تلفظ اصوات و رعایت پروزودی در آموزش گفتار به کمک کامپیوتر
- بهبود استنتاج در مدلهای گرافیکی فاکتوری با استفاده از روشهای مونت کارلو و بهکارگیری آن در کاربردهای پردازش صوت (دکتری)
- بهبود یادگیری در شبکههای باور عمیق (دکتری)
- تشخيص اسامي خاص و تبديل حرف به صدا براي آنها در زبان فارسي
- تعیین نوع دستوری کلمات زبان فارسی با بکارگیری روشهای ترکیبی نوین
- خلاصه سازی گزینشی چند سندی متون فارسی
- برچسبگذاری خودکار کنشهای احساسی و گفتاری متن فارسی
نمونههايي از زمینههای تحقیقاتی:
- بازشناسي گفتار و گوينده
- بازشناسی مقاوم در محیطهای نویزی و بهسازی گفتار
- سنتز و تبديل متن به گفتار
- كد كردن و فشرده سازي گفتار
- بازشناسي زبان
- وقایع نگاری فایلهای صوتی
- برقراري ارتباط گفتاري دوجانبه بين انسان و كامپيوتر
- تشخیص سن و زن و مرد بودن به کمک صدا
- پردازش سیگنالها از جمله سیگنال موسیقی و سيگنال هاي بيوالكتريك
10. طراحی واسط مغز و کامپیوتر
امكانات آزمایشگاه:
- كامپيوتر شخصي
- سرورهای پرقدرت برای محاسبات سنگین
- انواع پایگاههای داده صوتی
- انواع پیکرههای متنی
- كارتهای دريافت سیگنال
- کارت اينترفيس تلفني Dialigics
- ميكروفون با كيفيت بالا
- كارت DSP
- نرم افزارهاي مورد نياز
- ساير امكانات مورد نياز جهت ضبط، پخش و آناليز صوت و گفتار