فناوری زبان انسانی و یادگیری ماشین

فناوری زبان انسانی و یادگیری ماشین

شهرام خديوي

  • معرفي

با توجه به روند رو به رشد حجم داده ها در اینترنت و سازمان ها، لزوم استخراج دانش مفید از این داده ها بیش از هر زمان دیگر به چشم می خورد. یکی از انواع فراوان داده های اینترنتی، متون زبان های مختلف است که بستر مناسبی برای توسعه فناوریهای زبان انسانی با اتکاء به رویکرد یادگیری از روی داده ها فراهم آورده است. شاهدی بر این مدعا، استفاده از این رویکرد در یکی از پیچیده ترین مسائل پردازش زبان طبیعی، یعنی سیستم های ترجمه ماشینی، و نتایج خوب حاصل از آن در مقایسه با سیستم های سنتی (مبتنی بر قانون) است. با این مقدمه، رویکرد این آزمایشگاه یادگیری از روی داده های خام به طور عام، و به طور خاص روش های پردازش زبان طبیعی می باشد.