اگر به یک انسان، عکسی را نشان دهیم، او می‌تواند با دقت زیادی پیش‌بینی کند که در لحظات بعد چه اتفاقی می‌افتد. مثلا زنی که دوچرخه‌سواری می‌کند، به حرکتش ادامه می‌دهد؛ یک سگ فریزبی را می‌گیرد؛ مردی به زمین می‌خورد. این مهارت آنقدر ساده و ابتدایی است که ما حجم عظیم اطلاعات برای انجام این پیش‌بینی‌ها را در نظر نمی‌گیریم. اما آموزش این مهارت به کامپیوتر‌ها یکی از چالش‌های بزرگ هوش مصنوعی است.

محققان دانشگاه MIT در تلاش‌شان برای حل این مشکل به نتایج شگفت‌انگیزی رسیده‌اند. آنها به طور ویژه به شبکه‌های عصبی آموزش دادند تا تصاویر را به ویدیو تبدیل کنند. به این طریق، کامپیوترها می‌توانند پیش‌بینی کنند که چه اتفاقی می‌افتد. این مدل آنها محدودیت‌هایی دارد، ویدیوهای آنها تنها چند ثانیه، بسیار کوچک و اغلب کابوس‌وار هستند. اما در هر حال، شاهکار جالبی از تخیل یک ماشین است و یک قدم به سمت کامپیوترهایی است که می‌توانند دنیای انسان‌ها را کمی بهتر بفهمند.

محققان با استفاده از بیش از ۲ میلیون ویدیو به شبکه عصبی آموزش دادند. این ویدیوها به چهار دسته زمین گلف، ساحل، ایستگاه قطار و بیمارستان تقسیم شده بودند. این شبکه عصبی با استفاده از این داده‌ها نه تنها توانست ویدیوهای کوتاهی شبیه به این صحنه‌ها تولیدکند، بلکه با نگاه به تصاویر ثابت، ویدیوهایی تولید کرد که نشان می‌داد چه اتفاقی می‌افتد. این شبکه عصبی حدس می‌زند که پس از مدتی چه اتفاقی می‌افتد؛ البته این کار را با پیش‌بینی درباره نحوه تغییر پیکسل‌ها انجام می‌دهد.

 

دایناسورها چگونه به پرندگان تکامل یافتند: اژدهایان دنیای واقعی
مشاهده