اگر به تازگی اسم شنگ شو ویدار (ShengShu’s Vidar) را شنیده‌اید و اطلاعاتی از آن ندارید، در این مطلب به معرفی کامل آن پرداخته‌ایم.

به گزارش تکراتو و به نقل از gizmochina، شرکت فناوری شنگ شو اخیراً از ویدار (Vidar) رونمایی کرده است؛ یک مدل پیشرفته از هوش مصنوعی مجسم (Embodied AI) که هدف آن تغییر بنیادین در روش آموزش ربات‌های انسان‌نمای مصرفی است.

هوش مصنوعی شنگ شو ویدار

این سیستم به جای ماه‌ها جمع‌آوری داده‌های گران‌قیمت و زمان‌بر در دنیای واقعی که معمولاً در توسعهٔ سنتی ربات‌ها انجام می‌شود بر ترکیبی منحصربه‌فرد از داده‌های فیزیکی بسیار کم و شبیه‌سازی‌های وسیع تولیدشده توسط هوش مصنوعی تکیه می‌کند. نتیجه این رویکرد، چرخه‌های یادگیری سریع‌تر، هزینه توسعه پایین‌تر و در عین حال حفظ واقع‌گرایی و قابلیت سازگاری بالا است.

رویکرد اصلی و زیرساخت فناوری

ویدار بر پایهٔ موتور تولید ویدیوی «ویدو» (Vidu) ساخته شده است؛ پلتفرمی که پیش‌تر در حوزه‌های خلاقانه و صنعتی شهرت بالایی پیدا کرده و عملکرد آن به اثبات رسیده است.

این زیرساخت به ویدار امکان می‌دهد شبیه‌سازی‌های چند-زاویه‌ای بسیار واقع‌گرایانه‌ای تولید کند که پیچیدگی محیط‌های واقعی را به خوبی بازتاب می‌دهند. سیستم با یادگیری تنها از یک مجموعهٔ کوچک فیلم‌های واقعی، می‌تواند سناریوهای آموزشی دقیقی را در مقیاس وسیع بسازد و این فرآیند را بسیار کارآمدتر از روش‌های صرفاً فیزیکی کند.

نوآوری کلیدی: آموزش هیبریدی

بارزترین نوآوری ویدار، روش «آموزش هیبریدی» آن است. در این روش، تنها ۲۰ دقیقه دادهٔ دنیای واقعی با حجم عظیمی از سناریوهای شبیه‌سازی‌شده توسط هوش مصنوعی ترکیب می‌شود. این ترکیب باعث می‌شود کارایی داده‌ها تا ۱۲۰۰ برابر بیشتر از سامانه‌های مشابه مانند RDT یا π0.5 باشد.

این رویکرد، غیرقابل پیش‌بینی بودن و واقع‌گرایی دنیای واقعی را حفظ می‌کند، در حالی که سرعت و انعطاف‌پذیری محیط‌های شبیه‌سازی را نیز به کار می‌گیرد. نتیجه این است که ربات‌ها می‌توانند سریع‌تر با شرایط متنوع و پیش‌بینی‌ناپذیر سازگار شوند – قابلیتی که در دنیای واقعی به شدت اهمیت دارد.

حل مشکل بزرگ آموزش فیزیکی در هوش مصنوعی

در حوزه رباتیک، آموزش معمولاً بین دو رویکرد افراطی قرار می‌گیرد:

  1. آموزش کاملاً واقعی – همانند آنچه تسلا در ربات Optimus یا بوستون داینامیکس در Atlas استفاده می‌کند، که هرچند واقع‌گرایی بی‌نظیری دارد، اما بسیار کند، گران و وابسته به سخت‌افزار پیچیده است.
  2. شبیه‌سازی کامل – سریع‌تر و ارزان‌تر است، اما نمی‌تواند پیچیدگی‌ها و غیرقابل‌پیش‌بینی بودن دنیای واقعی را به طور کامل بازتاب دهد.

ویدار دقیقاً بین این دو روش قرار می‌گیرد و یک تعادل ایجاد می‌کند: واقع‌گرایی آموزش واقعی + مقیاس‌پذیری و سرعت شبیه‌سازی‌های هوش مصنوعی. این تعادل باعث می‌شود فرایند آموزش هم اقتصادی باشد و هم بسیار سریع.

خط لولهٔ دو مرحله‌ای آموزش

برای رسیدن به بیشترین کارایی، ویدار فرایند آموزش را به دو مرحله تقسیم می‌کند:

  • مرحله ادراک (Perception Stage)
    در این مرحله، سیستم با استفاده از مجموعه‌های عظیم ویدیوهای عمومی و ویدیوهای مرتبط با محیط ربات‌ها، شناخت عمیقی از اشیا، فضاها و محیط‌ها پیدا می‌کند.
  • مرحله کنترل (Control Stage)
    مدل «AnyPos» ویدار این درک صحنه را به دستورهای حرکتی دقیق تبدیل می‌کند. این قابلیت باعث می‌شود سیستم بتواند انواع مختلف طراحی‌های ربات را بدون نیاز به آموزش دوباره هدایت کند.

این معماری دو مرحله‌ای، انعطاف‌پذیری فوق‌العاده‌ای ایجاد می‌کند و باعث می‌شود ویدار به طیف وسیعی از کاربردهای رباتیک سازگار باشد.

کاربردها و مزایای واقعی

طراحی ویدار به سخت‌افزار خاصی وابسته نیست، یعنی می‌توان از آن برای آموزش ربات‌هایی با شکل‌ها و اندازه‌های مختلف استفاده کرد. این انعطاف‌پذیری، آن را برای حوزه‌های گوناگون جذاب می‌کند:

  • کمک در منزل – از انجام کارهای خانه گرفته تا کمک به افراد با محدودیت حرکتی.
  • مراقبت از سالمندان – پشتیبانی روزمره، پایش سلامتی و ایجاد امنیت.
  • تولید هوشمند – اجرای کارهای تکراری و دقیق در خطوط تولید.
  • رباتیک پزشکی – یاری رساندن در جراحی‌ها یا خدمات درمانی.

قابلیت انطباق سریع با محیط جدید، مدیریت همزمان چند وظیفه، و کاهش چشمگیر زمان و هزینه توسعه، ویدار را برای بازارهای مصرفی، تجاری و صنعتی به یک گزینه جذاب تبدیل می‌کند.

میراث ویدو و آینده ویدار

ویدار بر پایه موفقیت مدل ویدیویی «ویدو» ساخته شده است؛ مدلی که در سه ماه اول، بیش از ۱۰ میلیون کاربر جذب کرد و ۳۰۰ میلیون ویدیو تولید نمود. اکنون با انتقال این دانش عمیق درک بصری به حوزه رباتیک، ویدار پلی مستقیم بین «ادراک» و «عمل» ایجاد کرده است.

به آینده که نگاه کنیم، ویدار می‌تواند آموزش ربات‌های انسان‌نما را از چند هفته به چند ساعت کاهش دهد. این جهش می‌تواند نقطه عطفی در تحقق رؤیای حضور ربات‌های توانمند در خانه‌ها و صنایع باشد؛ رؤیایی که سال‌هاست در ذهن بشر نقش بسته و حالا بیش از هر زمان دیگر نزدیک شده است.