استارت آپ چینی DeepSeek به تازگی هوش مصنوعی DeepSeek-R1 را ارائه کرده است که عملکرد آن شبیه به مدل معروف o1 از OpenAI است.
این مدل منبع باز نشان دهنده گام مهمی در رقابت جهانی برای توسعه است. هوش مصنوعی این انسان نما (AGI) است.
هوش مصنوعی DeepSeek-R1 ارزان تر از مدل o1 OpenAI است
مطابق بحران تکنولوژیکهوش مصنوعی DeepSeek-R1 که بر اساس فناوری های هیبریدی پیشرفته DeepSeek V3 طراحی شده است، عملکردی مشابه مدل o1 OpenAI در انجام وظایف پیچیده ریاضی، استدلال منطقی و کدنویسی دارد. اما مهمترین ویژگی این مدل منبع باز آن است که هزینه های محاسباتی را به میزان قابل توجهی کاهش می دهد. این مدل خاص 90-95٪ مقرون به صرفه تر از o1 است.
یکی از نکات برجسته عملکرد این مدل، توانایی آن در اصلاح مدل های مختلف هوش مصنوعی مانند Llama و Qwen است که عملکرد این مدل ها را به طور قابل توجهی در مقایسه با مدل های مشابه بهبود می بخشد. به عنوان مثال، مدل تصفیه شده Qwen-1.5B در تست های محک ریاضی از مدل های بزرگتر مانند GPT-4o و کلود 3.5 Sonnet بهتر عمل کرد.
مفهومی به نام تنظیم دقیق در اینجا مهم است. اصلاح هوش مصنوعی فرآیندی است که در آن از مدل های بزرگتر و پیچیده تر به عنوان استاد مدل های کوچکتر برای بهبود عملکرد آنها استفاده می شود. در این فرآیند، مدلهای سادهتر از دانش و مهارتهای مدلهای پیچیدهتر بهرهبرداری میکنند.
مقایسه عملکرد مدل های DeepSeek-R1 و o1 در تست های مختلف نشان می دهد که DeepSeek-R1 در بسیاری از تست ها به ویژه در ریاضیات و کدنویسی بهتر عمل می کند. به عنوان مثال، در آزمونهای ریاضی AIME 2024 و MATH-500، مدل DeepSeek-R1 به ترتیب 79.8% و 97.3% را کسب کرد. در حالی که مدل o1 امتیازهای 79.2% و 96.4% را کسب کرده است.
از نظر هزینه استفاده، مدل DeepSeek-R1 بسیار مقرون به صرفه تر است. برای هر میلیون توکن ورودی، هزینه استفاده از DeepSeek-R1 تنها 0.55 دلار است، در حالی که هزینه مدل o1 تقریباً 15 دلار است.
در نهایت، این مدلها تغییرات اساسی در توسعه هوش مصنوعی، به ویژه در زمینههای استدلال پیچیده و هوش مصنوعی شبیه انسان را نشان میدهند که میتواند به دستیابی به اهداف AGI در آیندهای نه چندان دور کمک کند.
بیشتر بخوانید:
ارسال نقد و بررسی