علی بابا اخیراً هوش مصنوعی QwQ را معرفی کرده است. به گفته سازنده، Qwen با هوش Question می تواند با هوش مصنوعی o1 در حل مسائل ریاضی و کدنویسی رقابت کند.
طبق اطلاعیه qwenlm مدل QwQ که دارای 32.5 میلیارد پارامتر است، از قابلیت های استدلال پیچیده استفاده می کند و می تواند حداکثر به 32 هزار توکن پاسخ دهد. این ویژگی به آن اجازه می دهد تا در مواردی که نیاز به استدلال منطقی یا برنامه ریزی دقیق است، بهتر کار کند. از جمله این موارد می توان به حل مسائل ریاضی و کدنویسی اشاره کرد.
معیارهای هوش مصنوعی Alibaba QwQ
در چندین معیار ارزیابی توانایی مدلها در حل مسائل ریاضی و استدلال علمی، هوش مصنوعی Qwen با Questions بهتر از مدل پیشنمایش o1 عمل میکند. به عنوان مثال، در معیارهای AIME و MATH که توانایی حل مسائل ریاضی را ارزیابی می کنند، QwQ توانست o1 را شکست دهد. علاوه بر این، در معیار GPQA که استدلال علمی را ارزیابی می کند، QwQ بهتر از o1-mini عمل کرد.
البته از نظر رمزگذاری، o1 در بنچمارک LiveCodeBench عملکرد بهتری داشت، اما QwQ همچنان بهتر از سایر مدلها مانند GPT-4o و کلود 3.5 Sonnet عمل کرد. این نشان میدهد که QwQ در حوزههای خاصی که نیاز به استدلال دقیق دارند، بهتر عمل میکند، اما در برخی حوزهها، مدلهای رقیب ممکن است قویتر باشند.
در خصوص روند آموزش این مدل، علی بابا اطلاعات دقیقی منتشر نکرده است، اما برخلاف o1، QwQ به صورت متن باز منتشر شده است. این بدان معنی است که فرآیند استدلال مدل برای کاربران قابل مشاهده است و آنها می توانند نحوه عملکرد مدل را ببینند و در هنگام حل مسائل پیچیده فکر کنند.
علی بابا در بیانیه ای اعلام کرد که هوش مصنوعی QwQ برای بهبود به روش هایی مانند «پرسش، تأمل و تفکر عمیق» متکی است. این فرآیند به مدل کمک کرده است تا به پیشرفت های قابل توجهی در حل مسائل پیچیده دست یابد. با این حال، این شرکت خاطرنشان کرد که QwQ ممکن است در برخی موارد با مشکلاتی مانند مخلوط کردن زبان ها یا گیر کردن در حلقه های استدلال مواجه شود.
در حال حاضر نسخه آزمایشی مدل QwQ موجود است و از طریق آن قابل دسترسی است صورت در آغوش گرفته آن را امتحان کنید. اما این مدل هنوز در مراحل اولیه خود است و به نظر می رسد نسخه نهایی و کاملتر آن در آینده ای نه چندان دور عرضه شود.
بیشتر بخوانید:
ارسال نقد و بررسی