گفتگو با دانشمند نیشابوری رشته «هوش مصنوعی» و دانشجوی پسادکتری دانشگاه آمستردام:  دنیای آینده، دنیای «علم داده» و «یادگیری ماشین» است
گفتگو با دانشمند نیشابوری رشته «هوش مصنوعی» و دانشجوی پسادکتری دانشگاه آمستردام:  دنیای آینده، دنیای «علم داده» و «یادگیری ماشین» است

  قرار شد این رشته از سال بعد در مقطع فوق لیسانس برای دانشگاه‌های شهید بهشتی و صنعتی شریف، تعریف شود. همین طور ما امیدواریم از سال های بعد، در مقاطع کارشناسی و دکترا هم شاهد اضافه شدن آن به فهرست رشته های سازمان سنجش باشیم. تمام تلاش ما طی رایزنی ها و ارتباطاتی که […]

 

  • قرار شد این رشته از سال بعد در مقطع فوق لیسانس برای دانشگاه‌های شهید بهشتی و صنعتی شریف، تعریف شود. همین طور ما امیدواریم از سال های بعد، در مقاطع کارشناسی و دکترا هم شاهد اضافه شدن آن به فهرست رشته های سازمان سنجش باشیم.
  • تمام تلاش ما طی رایزنی ها و ارتباطاتی که در جریان سفرهای متعدد به ایران داشته ایم، این بوده که بتوانیم رشته‌ی دیتا ساینس را در ایران جا بیندازیم؛ نکته این جاست که این رشته در بحث کارآفرینی بسیار مفید است. در حال حاضر فارغ التحصیلان رشته های مختلف بی‌کارند اما در دنیای دیتا ساینس برای این افراد کار فراوان است؛ رشته هایی مثل فیزیک و ریاضی تا پزشکی و جغرافیای شهری و…

 

فروغ خراشادی- از سال 2013 انقلابی در روش های یادگیری هوش مصنوعی در دنیا اتفاق افتاد که منجر به پیدایش مبحث جدیدی زیر عنوان «یادگیری عمیق» بر پایه و اساس شبکه های مصنوعی عصبی و با الهام از شبکه مغزی انسان شد.

کاربرد یادگیری عمیق هنگامی بیش از پیش خودنمایی می کند که که داده های فراوانی برای یک مساله وجود داشته باشد و جهت حل مساله به کار آید؛ چنان چه می دانیم در دنیای امروز دسترسی به اینترنت و تولید محتوا، با ابزار در دسترسی چون تلفن همراه میسر شده و به راحتی می توان محتوای تولید شده را با دیگران به اشتراک گذاشت. این داده های تولید شده با حجم بالا – اصطلاح با Big data برای استفاده در این دانش جهت حل مساله به کار می رود؛ یکی از افرادی که در این دانش نوین، پیشگام است و در آینده بیشتر از او در جهان «علمِ داده» خواهیم شنید، محقق و دانشمند نیشابوری ساکن هلند، «دکتر مسعود مظلوم» است.

مظلوم، محقق و دانشجوی دوره ی پسادکتری در موسسه انفورماتیک دانشگاه آمستردام هلند است که از دوره ی دکتری- در امریکا- و پس از آن در هلند، در زمینه ی Data science (علم داده ها) کار کرده و پروژه ی دکتری خود را روی هوش مصنوعی، بینایی ماشین، ماشین لرنینگ و به طور خاص روشی هوشمند برای کلاسه بندی ویدیوها بر اساس رخدادها، ارائه کرده است.

تز دکترای او بر این پرسش استوار است که: آیا می توان مدلی طراحی کرد که بتواند دیتا ها را طبقه بندی و برچسب گذاری کند؟

او که زاده ی نیشابور است و تا پایان دوره‌ی متوسطه در زادگاهش زندگی می کرده، برای کارشناسی، به صورت همزمان رشته‌ی ریاضی کاربردی را در دانشگاه فردوسی مشهد و مهندسی نرم افزار را در «تهران جنوب» گذرانده و دوره‌ی ارشد را در دانشگاه صنعتی شریف، هوش مصنوعی خوانده است. او مدتی رئیس بخش مهندسی کامپیوتر دانشگاه شریعتی تهران و استاد ارشد در بخش مهندسی دانشگاه شهید چمران اهواز بوده و سپس با  گرفتن بورس تحصیلی راهی امریکا شده است. سفر به امریکا، با کار روی پروژه ای در حوزه‌ی «یادگیری ماشین»  همراه شده و مهاجرت مجدد و زودهنگام دکتر مظلوم را به اتفاق استادش به هلند  و ادامه ی پژوهش و تحصیل در «مرکز تحقیقات علوم داده آمستردام» در پی داشته است.

برای آشنایی بیشتر با این دانشمند جوان همشهری و کارهایی که در زمینه ی علم داده ها انجام داده است، با او به گفتگو نشسته ایم.

از او می خواهیم برای مخاطبان خیام نامه از خودش و پروژه ی تحقیقاتی اش بگوید:

کلید واژه ی اصلی در عبارت «Data science» -علمِ داده- کلمه ی «دیتا» ست؛ برای حل مسائل پیچیده در زمینه های مختلف، اگر نیاز به جواب داشته باشیم، از حوزه‌ی دیتا ساینس باید کمک  بگیریم و بدون دیتا کاری از کسی بر نمی آید.

بر مبنای دیتا ساینس، تز پایان نامه ی دوره دکترای من و کتاب چاپ شده ی آن، به روشی معنادار برای نمایش رویدادهای مختلف در ویدیو ها می پردازد؛ در واقع کار ما ساخت سیستم تشخیصِ رویدادیِ دقیقی بوده که منتج به یک موتور جستجو ویدیویی دقیق و کارآمد شود و بتواند رویدادهای خاصی را بازیابی کند. مثلا اگر مجموعه ای ویدیو در فیلدهای مختلفی داشته باشیم، پیشنهاد ما این بود که از ویژگی های معنایی برای تجزیه و تحلیل یک رویداد در یک ویدیو استفاده شود و به صورت اتوماتیک آنچه که در ویدیو اتفاق می افتد تفسیر شود و به این ترتیب توانایی استفاده از ویژگی های معنایی یک رویداد در دسترس قرار گیرد. به عنوان مثال در دو رویداد جشن تولد و تعویض لاسیتک ماشین؛ این روش می تواند این دو را از هم تمیز داده و برچسب گذاری کند.  همین پروژه در رقابت های ویدیویی سالانه سال 2013 با عنوان  TRECVID مقام اول را به دست آورد.

دیتا ساینس؛ کارآفرینی و ارتباط با دنیا

آقای دکتر! شما در حال حاضر علاوه بر تحقیق و تدریس، سابقه ی کار صنعتی را در کارنامه دارید؛ از این تجربه و دانش شما در داخل کشور چگونه استفاده می شود؟

پژوهشگاه دانش های بنیادی (IPM) تهران، یک مرکز تحقیقاتی معتبر است که یکی از پژوهشکده های آن به علوم کامپیوتر اختصاص دارد. تمام تلاش ما طی رایزنی ها و ارتباطاتی که در جریان سفرهای متعدد به ایران داشته ایم، این بوده که بتوانیم رشته‌ی دیتا ساینس را در ایران جا بیندازیم؛ نکته این جاست که این رشته در بحث کارآفرینی بسیار مفید فایده است. در حال حاضر فارغ التحصیلان رشته های مختلف بی‌کارند اما در دنیای دیتا ساینس برای این افراد کار فراوان است؛ رشته هایی مثل فیزیک و ریاضی تا پزشکی و جغرافیای شهری و…؛ در همه ی این رشته ها، داده و محتواهای فراوانی ست که می تواند مورد استفاده قرار بگیرد.

از دیدگاه کارآفرینی و با دو رویکرد داخلی و ارتباط با دنیا، رشته‌ی دیتا ساینس می تواند مورد توجه قرار بگیرد؛

اول این که در ایران، دیتاهای طبقه بندی نشده درباره ی همه چیز، از آب و هوا تا نفت و برق و اقتصاد وجود دارد و دیگر این که پرداختن به علم داده ها، ضمن کارکرد داخلی، می تواند ما را با دنیا مرتبط کند.

به همین منظور از سال 2016 با مرکز IPM در تهران وارد گفتگو شدیم و از دیگر سو هم ضمن توصیف اهداف، مرکز تحقیقات علوم داده آمستردام را متقاعد به همکاری کردیم به این ترتیب نخستین گام حدود یک سال پیش در نوامبر 2017  با برگزاری نخستین سمینار بین المللی دیتا ساینس در تهران برداشته شد. این سمینار یک روزه علاوه بر استقبال چشمگیر، منجر به برگزاری سخنرانی های یک ساعت ونیمه و هر دو هفته یک بار در همین مرکز شد که با دعوت از دانشمندان خارجی که به ایران می آمدند، سامان می یافت.

اقدامات شما در ایران، در موسسه ی یادشده، منجر به برگزاری دو دوره کلاس های تابستانی هم شده است؛ این دوره ها چه گروه های هدفی را و برای چه مدت تحت آموزش قرار داد؟

مدارس تابستانه ی ما در دو مرحله ی مقدماتی و اصلی برگزار شد؛ دوره ی اول در خردادماه گذشته با ارائه‌ی 4 درس اصلی با 4 مدرس در یک هفته صورت پذیرفت.

اما دوره‌ی پیشرفته‌ی علم داده، با گزینش 100 نفر از میان 700 متقاضی، در مرداد و شهریورماه 97 باز هم در پژوهشگاه دانش های بنیادین برگزار شد و در این دوره از بین 10 مدرس، تنها یک نفر خارجی و بقیه استادهای ایرانی خارج از کشور بودند و البته تجربه ی تدریس در هر دو دوره ی این مدارس تابستانه هم، برای من خوشایند بود. در دوره‌ی اصلی، شرکت کنندگان از رشته های مختلفی مانند پزشکی و… شرکت داشتند و در پایان کلاس ها نیز دوره ی 3 روزه‌ی بازاریابی و استارتاپ برگزار شد که از مزایای آن، سفر کوتاه و رایگان تیم برنده به هلند و اختصاص فرصت مطالعاتی شش ماهه به اعضای تیم اول، از سوی مرکز تحقیقات آمستردام بود.

دکتر مظلوم؛ پایه گذار رشته‌ای نوین در سازمان سنجش

یکی از کارهایی که در سفر به ایران انجام دادید، افزودن رشته‌ای در فهرست دفترچه ی کارشناسی ارشد سال آینده است؛ به نوعی گویا شما پایه گذار رشته‌ی دیتا ساینس در سازمان سنجش هستید؛ چشم انداز این رشته را چگونه ارزیابی می کنید؟

قرار شد این رشته از سال بعد در مقطع فوق لیسانس برای دانشگاه‌های شهید بهشتی و صنعتی شریف، تعریف شود. همین طور ما امیدواریم از سال های بعد، در مقاطع کارشناسی و دکترا هم شاهد اضافه شدن آن به فهرست رشته های سازمان سنجش باشیم.

دیتا ساینس در همه جای دنیا به کار می آید؛ این رشته دیگر مختص کامپیوتر نیست و در همه ی علوم کاربرد دارد؛ ما در دنیای هوش مصنوعی در موج دوم یعنی «علوم داده» هستیم؛ آینده اما همچنان دنیای هوش مصنوعی خواهد بود. برای آن که حرف هایی که تا این جا گفتیم شفاف شود، شما به پدیده ی یادگیری دقت کنید؛ چگونه مغز ما بین سگ و گربه تمایز و تفاوت قائل می شود؟ شاید فکر کنید کار راحتی ست؛ اما چنین نیست! حالا ما می خواهیم همین کار، توسط ماشین انجام شود. دنیای آینده به سویی می رود که هر کسی که می خواهد در زمینه ی تخصصی خودش موفق شود، لاجرم باید به سوی دیتا ساینس برود.

ضمن سپاس بابت گفتگو؛ سخنان شما با توجه به 25 مقاله ی علمی چاپی و ارائه شده در کنفرانس ها، از درجه اعتبار علمی بالایی برخورد است؛ این مقاله ها از پر ارجاع ترین ها در حوزه ی تخصصی شما محسوب می شود و به همین دلیل، پاسخ های شما می تواند جایگاه ویژه ی دیتا ساینس را برای مخاطب «خیام نامه» تبیین کند؛ اما وقتی از کاربرد دیتا ساینس در همه‌ی علوم سخن به میان می آید، آیا این مساله شامل علوم انسانی، مثلا فلسفه هم می شود؟

درباره‌ی فلسفه خیلی زود است انتظار داشته باشیم که ماشین به سراغ تجزیه و تحلیل مفاهیم برود اما در آینده دور از ذهن نیست و اگر دیتایی داشته باشیم، ماشین می تواند یاد بگیرد که چگونه دسته بندی کند و در ادامه، راه برای کارهای تخصصی تر مانند تجزیه و تحلیل هم بسته نیست.