گوگل اخیراً Gemini 2.0 Flash را معرفی کرده است. این مدل می تواند متن، تصویر و صدا تولید کند و امکانات بیشتری نسبت به مدل قبلی ارائه می دهد.
به عنوان blog.google همانطور که گزارش شده است، Gemina 2.0 Flash علاوه بر ایجاد محتوا، از برنامه ها و خدمات شخص ثالث نیز پشتیبانی می کند. این ویژگی چه کاری انجام می دهد؟ این ویژگی به کاربران اجازه می دهد از موتور جستجوی گوگل استفاده کنند یا حالت های مختلف را در حین استفاده از سایر برنامه های خدماتی اجرا کنند.
Flash Gemini 2.0; مدل جدید هوش مصنوعی گوگل با قابلیت تولید صدا و تصویر
نسخه آزمایشی این مدل از طریق Gemini API و پلتفرمهای AI Studio و Vertex AI در دسترس است، اما قابلیت تولید صدا و ویدئو در حال حاضر تنها برای کاربران دسترسی زودهنگام فعال است و انتشار گسترده آن به ژانویه سال آینده موکول شده است .
گوگل تصمیم گرفته است نسخه پیشرفته تری از Gemini را به محصولات مختلف خود مانند Android Studio و Gemini Code Assist اضافه کند. نسل اول این هوش که اوایل امسال معرفی شد، تنها قادر به تولید متن بود و نمی توانست کارهای پیچیده ای را انجام دهد. اما اکنون گوگل نسخه 2.0 فلش را به عنوان یک مدل همه کاره همه کاره معرفی کرده است.
علاوه بر این مدل، گوگل از پروژه های دیگری نیز رونمایی کرده است. Project Astra یک سیستم بصری است که توانایی شناسایی اشیا را دارد و Gemini 2.0 Flash پیشرفت های چشمگیری در این زمینه داشته است. علاوه بر این، Project Mariner به عنوان یک افزونه جدید برای مرورگر کروم معرفی شده است که می تواند اطلاعات صفحه مرورگر را تجزیه و تحلیل کرده و از آن برای انجام کارهای مختلف استفاده کند.
محصول دیگری به نام Jules معرفی شده است که به توسعه دهندگان کمک می کند کدهای شکسته خود را شناسایی و رفع کنند. این ابزار مبتنی بر Gemina 2.0 می تواند صفحه نمایش کاربر را کنترل کند و به بازی های ویدیویی کمک کند.
بیشتر بخوانید:
ارسال نقد و بررسی