تیمی از محققان موفق به ایجاد هوش مصنوعی S1 برای استدلال منطقی تنها 26 دقیقه با هزینه کمتر از 50 دلار شدند. محققان تأیید می کنند که S1 تا 27 ٪ برای حل مشکلات ریاضی نسبت به نسخه اولیه O1 داشته است.
طبق گفته Takrato ذکر شده توسط توقفتیم تحقیقاتی دانشگاه های استنفورد و واشنگتن از تکنیکی به نام تقطیر برای توسعه مدل خود استفاده کردند. این روش به مدلهای کوچکتر اجازه می دهد تا از مدل های بزرگتر استفاده کنند.
هوش مصنوعی S1 با کمک پاسخهای جمینی بهینه شد
محققان S1 را بر اساس پاسخ های تجربی Gemini 2.0 Flash Thinking Google بهینه کردند. البته ، شرایط استفاده از Google API مشخص می کند که کاربران نمی توانند از جمینی برای توسعه رقبا استفاده کنند. Edge برای اظهار نظر به Google پاسخ داده است ، اما هنوز پاسخی دریافت نکرده است.
S1 بر اساس QWEN2.5 ، مدل منبع ابری Alibaba ساخته شده است. در ابتدا ، محققان از مجموعه ای از داده ها استفاده كردند كه شامل 59000 سؤال برای آموزش مدل بود ، اما دریافتند كه كاهش این تعداد به 1000 سؤال تأثیر قابل توجهی در عملکرد مدل ندارد. این مدل فقط با استفاده از 16 کارت گرافیکی Nvidia H100 آموزش داده می شود.
یکی از تکنیک های کلیدی مورد استفاده در مدل S1 ، مقیاس زمان آزمون است که به مدل اجازه می دهد تا قبل از ارائه پاسخ ، زمان بیشتری را فکر کند. محققان او را مجبور کردند با اضافه کردن عبارت “صبر” در خروج مدل ، پاسخ های خود را دوباره بررسی کند. طبق مقاله منتشر شده ، این روش منجر به بررسی مجدد پاسخ های آن شده و خطاهای منطقی را اصلاح می کند.
مدل O1 همچنین از OpenAI استفاده می کند. اخیراً ، استارتاپ عمیق SIK در تلاش است تا این رویکرد را با هزینه بسیار کمتری تکرار کند. Operai Deepseek را به انجام اطلاعات در مورد مدل های این شرکت متهم کرده است و آن را به عنوان رقیب برای آن تبدیل کرده و بنابراین شرایط استفاده از OpenAI را نقض کرده است.
ظاهر مدل ها هوش مصنوعی کوچکتر و ارزانترین می تواند کل صنعت را تغییر دهد. اگر این مدل ها کارآمد باشند که در آن مدل های غول پیکر مانند OpenAI ، Microsoft ، Meta و Google نیازی به هزینه چند میلیونر برای آموزش مدل های خود ندارند ، راه توسعه هوش مصنوعی می تواند تغییرات اساسی داشته باشد.
ارسال نقد و بررسی