خلاصه مقاله
مقاله SAM 2 از تیم تحقیقاتی متا، معرفیکننده یک مدل پیشرفته و کارآمد برای جداسازی اشیاء (Segmentation) در تصاویر و ویدیوهاست. این مدل با بهرهگیری از معماری ترنسفورمر و فناوریهای نوین، قادر است با حداقل تعامل کاربر، اشیاء را با دقت بالا در ویدیوهای پیوسته و تصاویر پیچیده تشخیص دهد. برخلاف نسخه قبلی که تنها روی تصاویر ایستا تمرکز داشت، SAM 2 با افزایش چشمگیر سرعت و بهینهسازی عملکرد، بهصورت لحظهای در ویدیوها نیز عمل میکند و نیاز به کلیک یا اشارههای زیاد کاربر را کاهش میدهد. این پیشرفتها باعث شده SAM 2 بهعنوان یک ابزار قدرتمند در زمینههای مختلفی مانند رباتیک، ویرایش ویدیو، واقعیت افزوده و تولید محتوا به کار رود و افقهای جدیدی در هوش مصنوعی بینایی باز کند.
لینک مقاله: https://arxiv.org/abs/2407.10490
دانلود مستقیم PDF: https://arxiv.org/pdf/2407.10490.pdf