
معرفی شنگ شو ویدار ؛ هوش مصنوعیای که تنها با 20 دقیقه داده، یک ربات انساننما را به طور کامل آموزش میدهد
اگر به تازگی اسم شنگ شو ویدار (ShengShu’s Vidar) را شنیدهاید و اطلاعاتی از آن ندارید، در این مطلب به معرفی کامل آن پرداختهایم.
به گزارش تکراتو و به نقل از gizmochina، شرکت فناوری شنگ شو اخیراً از ویدار (Vidar) رونمایی کرده است؛ یک مدل پیشرفته از هوش مصنوعی مجسم (Embodied AI) که هدف آن تغییر بنیادین در روش آموزش رباتهای انساننمای مصرفی است.
هوش مصنوعی شنگ شو ویدار
این سیستم به جای ماهها جمعآوری دادههای گرانقیمت و زمانبر در دنیای واقعی که معمولاً در توسعهٔ سنتی رباتها انجام میشود بر ترکیبی منحصربهفرد از دادههای فیزیکی بسیار کم و شبیهسازیهای وسیع تولیدشده توسط هوش مصنوعی تکیه میکند. نتیجه این رویکرد، چرخههای یادگیری سریعتر، هزینه توسعه پایینتر و در عین حال حفظ واقعگرایی و قابلیت سازگاری بالا است.
رویکرد اصلی و زیرساخت فناوری
ویدار بر پایهٔ موتور تولید ویدیوی «ویدو» (Vidu) ساخته شده است؛ پلتفرمی که پیشتر در حوزههای خلاقانه و صنعتی شهرت بالایی پیدا کرده و عملکرد آن به اثبات رسیده است.
این زیرساخت به ویدار امکان میدهد شبیهسازیهای چند-زاویهای بسیار واقعگرایانهای تولید کند که پیچیدگی محیطهای واقعی را به خوبی بازتاب میدهند. سیستم با یادگیری تنها از یک مجموعهٔ کوچک فیلمهای واقعی، میتواند سناریوهای آموزشی دقیقی را در مقیاس وسیع بسازد و این فرآیند را بسیار کارآمدتر از روشهای صرفاً فیزیکی کند.
نوآوری کلیدی: آموزش هیبریدی
بارزترین نوآوری ویدار، روش «آموزش هیبریدی» آن است. در این روش، تنها ۲۰ دقیقه دادهٔ دنیای واقعی با حجم عظیمی از سناریوهای شبیهسازیشده توسط هوش مصنوعی ترکیب میشود. این ترکیب باعث میشود کارایی دادهها تا ۱۲۰۰ برابر بیشتر از سامانههای مشابه مانند RDT یا π0.5 باشد.
این رویکرد، غیرقابل پیشبینی بودن و واقعگرایی دنیای واقعی را حفظ میکند، در حالی که سرعت و انعطافپذیری محیطهای شبیهسازی را نیز به کار میگیرد. نتیجه این است که رباتها میتوانند سریعتر با شرایط متنوع و پیشبینیناپذیر سازگار شوند – قابلیتی که در دنیای واقعی به شدت اهمیت دارد.
حل مشکل بزرگ آموزش فیزیکی در هوش مصنوعی
در حوزه رباتیک، آموزش معمولاً بین دو رویکرد افراطی قرار میگیرد:
- آموزش کاملاً واقعی – همانند آنچه تسلا در ربات Optimus یا بوستون داینامیکس در Atlas استفاده میکند، که هرچند واقعگرایی بینظیری دارد، اما بسیار کند، گران و وابسته به سختافزار پیچیده است.
- شبیهسازی کامل – سریعتر و ارزانتر است، اما نمیتواند پیچیدگیها و غیرقابلپیشبینی بودن دنیای واقعی را به طور کامل بازتاب دهد.
ویدار دقیقاً بین این دو روش قرار میگیرد و یک تعادل ایجاد میکند: واقعگرایی آموزش واقعی + مقیاسپذیری و سرعت شبیهسازیهای هوش مصنوعی. این تعادل باعث میشود فرایند آموزش هم اقتصادی باشد و هم بسیار سریع.
خط لولهٔ دو مرحلهای آموزش
برای رسیدن به بیشترین کارایی، ویدار فرایند آموزش را به دو مرحله تقسیم میکند:
- مرحله ادراک (Perception Stage)
در این مرحله، سیستم با استفاده از مجموعههای عظیم ویدیوهای عمومی و ویدیوهای مرتبط با محیط رباتها، شناخت عمیقی از اشیا، فضاها و محیطها پیدا میکند. - مرحله کنترل (Control Stage)
مدل «AnyPos» ویدار این درک صحنه را به دستورهای حرکتی دقیق تبدیل میکند. این قابلیت باعث میشود سیستم بتواند انواع مختلف طراحیهای ربات را بدون نیاز به آموزش دوباره هدایت کند.
این معماری دو مرحلهای، انعطافپذیری فوقالعادهای ایجاد میکند و باعث میشود ویدار به طیف وسیعی از کاربردهای رباتیک سازگار باشد.
کاربردها و مزایای واقعی
طراحی ویدار به سختافزار خاصی وابسته نیست، یعنی میتوان از آن برای آموزش رباتهایی با شکلها و اندازههای مختلف استفاده کرد. این انعطافپذیری، آن را برای حوزههای گوناگون جذاب میکند:
- کمک در منزل – از انجام کارهای خانه گرفته تا کمک به افراد با محدودیت حرکتی.
- مراقبت از سالمندان – پشتیبانی روزمره، پایش سلامتی و ایجاد امنیت.
- تولید هوشمند – اجرای کارهای تکراری و دقیق در خطوط تولید.
- رباتیک پزشکی – یاری رساندن در جراحیها یا خدمات درمانی.
قابلیت انطباق سریع با محیط جدید، مدیریت همزمان چند وظیفه، و کاهش چشمگیر زمان و هزینه توسعه، ویدار را برای بازارهای مصرفی، تجاری و صنعتی به یک گزینه جذاب تبدیل میکند.
میراث ویدو و آینده ویدار
ویدار بر پایه موفقیت مدل ویدیویی «ویدو» ساخته شده است؛ مدلی که در سه ماه اول، بیش از ۱۰ میلیون کاربر جذب کرد و ۳۰۰ میلیون ویدیو تولید نمود. اکنون با انتقال این دانش عمیق درک بصری به حوزه رباتیک، ویدار پلی مستقیم بین «ادراک» و «عمل» ایجاد کرده است.
به آینده که نگاه کنیم، ویدار میتواند آموزش رباتهای انساننما را از چند هفته به چند ساعت کاهش دهد. این جهش میتواند نقطه عطفی در تحقق رؤیای حضور رباتهای توانمند در خانهها و صنایع باشد؛ رؤیایی که سالهاست در ذهن بشر نقش بسته و حالا بیش از هر زمان دیگر نزدیک شده است.