آزمایشگاه سیستم های هوشمند چندرسانه ای

آزمایشگاه سیستم های هوشمند چندرسانه ای

 • معرفي

 آزمایشگاه پردازش هوشمند داده‌های چند رسانه‌ای (آزمایشگاه پردازش هوشمند داده‌‌های صوتی-گفتاری سابق)، در سال 1375 تاسیس یافته است.

امروزه نیاز به تحقیقات برای توسعه تکنیک‌های پردازش داده‌های چندرسانه‌ای بسیار مهم و ضروری است. ماموریت این آزمایشگاه توسعه الگوریتم‌های پیشرفته برای پردازش داده‌های چندرسانه‌ای و توسعه سیستم‌ای چندرسانه‌ای هوشمند است.

دانش و تجربیات فراهم شده در طی حدود 20 سال از تاسیس این آزمایشگاه، امکان توسعه سیستم‌های چندرسانه‌ای با استفاده از دانش‌ها و تکنیک‌های در حد مرزهای دانش را فراهم نموده است. این آزمایشگاه در زمینه کاری خود از جمله آزمایشگاه‌های پیشتاز در دانشگاه‌های کشور در زمینه پردازش سیگنال‌ها خصوص پردازش صوت و گفتار و نیز متن می‌باشد.

 

پروژه‌ها و فعالیت‌ها:

 • ·        انجام پروژ‌ه‌های دانشجویی اعم از کارشناسی، کارشناسی ارشد و دکتری
 • ·        انجام پروژ‌ه‌های تحقیقاتی و طرح‌های ملی و مستقل
 • انجام پروژه‌های صنعتی

 

بعضي از پروژه‌هاي کارشناسی ارشد و دکتری انجام شده و يا در حال انجام عبارتند از:

 1.  آوانويسي و مرزبندي زماني پايگاه‌هاي داده گفتار فارس
 2. بازشناسي اتوماتيك بعضي از زبانهاي رايج در ايران به كمك روش‌هاي آماري
 3. تصديق هويت گوينده با استفاده از شبكه‌هاي عصبي و الگوريتم‌هاي ژنتيكي
 4. طراحي و ساخت سيستم تبديل متن به واج براي زبان فارسي
 5. تشخيص گفتاري شماره شناسايي شخصي
 6. تائيد هويت گوينده بصورت مستقل از متن: مدل كردن كوينده ها،  محيط‌هاي غير متعارف، تصميم‌گيري
 7. تعيين هويت گوينده روي شبكه اينترنت
 8. طراحي و پياده سازي سيستم توليد گفتار فارسي با تاكيد بر بهبود هرچه بيشتر كيفيت گفتار توليد شده
 9. بازشناسي اعداد پيوسته فارسي مستقل از گوينده
 10.  تقطيع گفتار فارسي به واحدهاي واكدار- بيواك، هجا و واج
 11.  عيب يابي موتورهاي دوار به روش آناليز ارتعاشات
 12.  شناسائي كلمات كليدي در گفتار پيوسته فارسي
 13. بازشناسي گفتار پيوسته فارسي
 14.  تعيين هويت گوينده مجموعه باز: برسي روش هاي افزايش سرعت و دقت
 15.  تعيين هويت گوينده در شرائط غير متعارف: ارزيابي روشها و ارائه دستورالعمل‌هاي مناسب
 16.  تخمين پارامترهاي سنتز گفتار فارسي با استفاده از تكنيك‌هاي يادگيري
 17.  بررسي مسائل زبان طبيعي براي يک سيستم تبديل متن به گفتار فارسي
 18.  ارزيابي تاثير روشهاي انتقال و فشرده سازي گفتار در شبکه‌هاي کامپيوتري بر کارايي سيستم‌هاي بازشناسي گوينده
 19.  مدل‌سازي تغييرات زيروبمي، كشش و شدت گفتار در زبان فارسي ( بكار گيري در سنتزگفتار فارسي)
 20.  بهبود راندمان سيستم‌هاي تصديق هويت گوينده با استفاده از اطلاعات مفهومي گفتار
 21.  نشانه‌گذاري گفتار چندين گوينده در مدارك و مستندات گفتاري
 22.  طراحي و ساخت وكدر گفتار با ترخ بيت بسيار پايين با استفاده از روش‌هاي شناسايي و سنتز گفتار
 23.  توليد و انتخاب واحد سنتز و ايجاد واحدهاي سنتز ناموجود براي سنتز گفتار فارسي
 24.  استفاده از فناوري پردازش گفتار در آموزش زبان خارجي به كمك كامپيوتر
 25.  تشخيص نفوذ با استفاده از مدل مخلوط گوسي و مقايسه و تركيب آن با ماشين بردار پشتيبان
 26.  ارائه پردازش اوليه مناسب براي مقاوم سازي سيستم هاي بازشناسي خودكار گفتار (دکتري استاد مشاور)
 27.  تشخيص هويت با استفاده از گفتار و مدل ماهيچه‌هاي مولد حركات (دکتري استاد مشاور)
 28.  مقاوم‌سازي بازشناسي گفتار در محيط با نويز ناهمبسته با استفاده از پردازش چندين باندي (دکتري استاد مشاور)
 29.  پياده‌سازي و بهبود عملکرد کد‌کننده‌هاي با نرخ پائين و بسيار پائين
 30.  مقاوم‌سازي سيستم هاي بازشناسي گفتار و گوينده در مقابل نويزهاي جمع شونده و نويز کانال
 31.  تشخيص محل کسره اضافه در متون فارسي جهت استفاده در تبديل متن به گفتار
 32.  مقايسه و انتخاب روش‌هاي مناسب مبتني بر دانش و پيکره براي تحليل معنايي در سيستم هاي تبديل  متن به گفتار فارسي
 33.  ارائه شيوه انطباق تکنيک‌هاي واقعيت مجازي در تجارت الکترونيکي
 34.  ارزيابي کيفيت صوت در شبکه هاي مبتني بر IP با استفاده از پارامترهاي کيفيت سرويس شبکه
 35. ارائه و ارزيابي يک سيستم تشخيص نفوذ به شبکه‌هاي کامپيوتري مبتني بر روش‌هاي تشخيص جرم در جوامع انساني
 36.  بهبود مدل اکوستيکي گفتار مبتني بر مدل پنهان مارکوف (دکتری)
 37.  تطبيق مدل در بازشناسي گفتار و گوينده با استفاده از الگوريتم ژنتيک و آموزش تطبيقي خوشه‌ها
 38.  مدل کردن نواي گفتار با استفاده از روش‌هاي داده‌گرا و قانون‌گرا
 39.  بازشناسي گوينده، مبتني بر همجوشي و فضاي حالت ساخته شده از گويندگان ويژه.
 40.  مقاوم‌سازي سيستم‌هاي بازشناسي گفتار و گوينده
 41.  تشخيص محل کسره اضافه در متون فارسي جهت استفاده در تبديل متن به گفتار
 42.  مقايسه و انتخاب روش‌هاي مناسب مبتني بر دانش و پيکره براي تحليل معنايي در سيستم‌هاي تبديل متن به گفتار فارسي
 43.  ارائه و ارزيابي يک سيستم تشخيص نفوذ به شبکه‌هاي کامپيوتري مبتني برروش‌هاي تشخيص جرم در جوامع انساني
 44.  پياده‌سازي و بهبود عملکرد کد‌کننده هاي با نرخ بيت پائين و بسيار پائين
 45.  بهبود بازشناسي کلمات کليدي و بکارگيري آن در دسترسي صوتي به خدمات تلفني
 46.  ارائه روش‌هايي جهت بهبود کارائي در تشخيص صوتي زبان
 47.  شاخص‌گذاري گوينده مبتني بر مدل ميدان‌هاي تصادفي شرطي (دکتری)
 48.  بهبود کارايي سيستمهاي بازشناسي گوينده با استفاده از شبکه هاي بيزي پويا (دکتری)
 49.  بکارگيري برنامه نويسي ژنتيک در بهبود کارايي سيستم‌هاي بازشناسي گوينده
 50.  سنتز گفتار مبتنی بر روش انتخاب واحد از دادگان‌های بزرگ، تعیین توابع هزینه، پیرایش دادگان و بهبود گفتار در محل اتصال واحدها
 51.  تعيين محدوده سني و زن و مرد بودن گوينده در نمايه‌سازي فايلهاي صوتي
 52.  طراحي و پياده‌سازي سیستم ترجمه گفتار به گفتار فارسی-انگلیسی با دامنه محدود
 53.  نمايه سازي اسناد صوتي به گفتار، موسيقي، سکوت و نويزهاي زمينه
 54.  بهبود تشخيص خودکار زبان گفتاری بر مبنای اطلاعات اکوستيکی
 55.  بهبود روش‌های واحدسازی و نرمال‌سازی متون در زبان فارسی
 56.  تبديل نويسه به صدا در زبان فارسی با استفاده از ويژگي‌هاي املائی و آوايي زبان فارسی
 57.  رفع ابهام از کلمات همنویسه فارسی به کمک شبکه معنایی کلمات و گنجواژه
 58.  تشخیص واحدهای اسمی مبتنی بر خصوصیات آنها در متون فارسی
 59.  آنالیز نوع و مشخصات مدولاسیون داده‌های دیجیتال با استفاده از روشهای پردازش رقمی سیگنال‌ها و تکنیک‌های هوشمند
 60.  شناسایی مقاوم نوع مدولاسیون و پارامترهای آن بصورت خودکار با استفاده از ابر بردارها
 61.  تبدیل صدای مستقل از متن
 62.  پیاده‌سازی و بهینه‌سازی الگوریتم‌های بازشناسی گفتار و گوینده بر روی سخت‌افزارهای با امکانات پردازشی محدود
 63.  بازشناسی گفتار محاوره‌ای-فی‌البداهه و تبدیل آن به گفتار رسمی-خواندنی
 64.  بهبود کارایی واسط مغز-رایانه از نقطه نظر سرعت و دقت
 65.  شناسایی و استخراج سیگنال‌های چندحامله؛ همسان سازی آنها و استخراج سمبول‌های مدوله شده
 66.  استفاده از روش‌های نیمه‌نظارتی در خلاصه‌سازی استخراجی گفتار
 67.  آموزش نحوه تلفظ اصوات و رعایت پروزودی در آموزش گفتار به کمک کامپیوتر
 68.  بهبود استنتاج در مدل‌های گرافیکی فاکتوری با استفاده از روش‌های مونت کارلو و به‌کارگیری آن در کاربردهای پردازش صوت (دکتری)
 69.  بهبود یادگیری در شبکه‌های باور عمیق (دکتری)
 70.  تشخيص اسامي خاص و تبديل حرف به صدا براي آنها در زبان فارسي
 71.  تعیین نوع دستوری کلمات زبان فارسی با بکارگیری روش‌های ترکیبی نوین
 72.  خلاصه سازی گزینشی چند سندی متون فارسی
 73.  برچسب‏گذاری خودکار کنش‏های احساسی و گفتاری متن فارسی

نمونه‌هايي از زمینه‌های تحقیقاتی:

 1. بازشناسي گفتار و گوينده
 2. بازشناسی مقاوم در محیط‌های نویزی و بهسازی گفتار
 3. سنتز و تبديل متن به گفتار
 4. كد كردن و فشرده سازي گفتار
 5. بازشناسي زبان
 6. وقایع نگاری فایل‌های صوتی
 7. برقراري ارتباط گفتاري دوجانبه بين انسان و كامپيوتر
 8. تشخیص سن و زن و مرد بودن به کمک صدا
 9. پردازش سیگنال‌ها از جمله سیگنال موسیقی و سيگنال هاي بيوالكتريك

10. طراحی واسط مغز و کامپیوتر

 

 

امكانات آزمایشگاه:

 • كامپيوتر شخصي
 • سرورهای پرقدرت برای محاسبات سنگین
 • انواع پایگاه‌های داده صوتی
 • انواع پیکره‌های متنی                                                     
 • كارت‌های دريافت سیگنال                                                                  
 • کارت اينترفيس تلفني  Dialigics                                               
 • ميكروفون با كيفيت بالا                                                            
 • كارت DSP                                                                    
 • نرم افزارهاي مورد نياز
 • ساير امكانات مورد نياز جهت ضبط، پخش و آناليز صوت و گفتار