دن ایوز: هزینه کم آموزش اطلاعات عمیق “احتمالاً یک داستان تولیدی” است

دن ایوز: هزینه کم آموزش اطلاعات عمیق “احتمالاً یک داستان تولیدی” است

Deepseek با مدل R1 سر و صدای زیادی در صنعت هوش مصنوعی ایجاد کرده است. مدلهای هوش مصنوعی این شرکت در بسیاری از معیارها عملکرد برابر یا حتی بهتر از رقبا دارند. اما آنچه بیشترین توجه را به خود جلب کرده است این است که این شرکت هزینه کم آموزش مدل های خود را تأیید می کند. با این حال ، برخی از کارشناسان در این بیانیه شک دارند. به عنوان یکی از تحلیلگران کم کم ، هوش depsic یک داستان تولیدی نامیده می شود.

گزارش شده است اندرویدی زیباشرکت های غربی که در زمینه هوش مصنوعی فعالیت می کنند ، به طور کلی صدها میلیون دلار برای آموزش مدل های خود هزینه می کنند. حتی تخمین زده می شود که نسل جدید مدل های پیشرفته به میلیاردها دلار سرمایه گذاری نیاز دارد.

راهنمای خرید تمپاتو

اما Deepseek هوش مصنوعی ادعا می کند که پیشرفته ترین مدل خود را با تنها 6 میلیون دلار در مدل پیشرفته خود آموزش داده است و طی چند ماه این کار را انجام داده است.

تخیل کم هزینه آموزش اطلاعاتی دیپاتیک چقدر واقعی است؟

این شرکت می گوید به جای استفاده از سخت افزار مدرن ، به تراشه های Nvidia H800 قدیمی تر متوسل شده است تا هزینه آموزش را کاهش دهد. علاوه بر این ، همکاری نزدیک تجارت هوش مصنوعی در چین عاملی را برای کاهش هزینه ها در نظر بگیرید.

اما دن ایویس ، تحلیلگر Wedbush ، این جمله را “احتمالاً یک داستان تولیدی” خوانده است. به عنوان یک مقایسه ، مدل Operai GPT-4 حدود 100 میلیون دلار هزینه دارد.

علاوه بر این ، Operai معتقد است که Depseek در فرایند آموزش مدل خود از “میانبر” استفاده کرده است. شرکت چینی ممکن است داده های مدل های GPT را با استفاده از فاصله از تکنیک تقطیر در سیستم خود ادغام کرده باشد.

این روش می تواند منابع زیادی را برای Depsic ذخیره کند ، اما قوانین Openai آن را ممنوع کرده است. این شرکت به توسعه دهندگان اجازه می دهد تا برنامه های مبتنی بر API را بسازند ، اما داده های استخراج مدل های آنها مجاز به آموزش سایر مدل های زبانی نیست.

سایر کارشناسان نیز از ادعای هزینه های عمیق دریغ می کنند

علاوه بر هزینه آموزش ، سخت افزاری که DiPsic برای این کار استفاده کرده است نیز مورد بحث قرار گرفته است. الكساندر وانگ ، مدیرعامل مقیاس هوش مصنوعی ، گفت كه Deep Six حدود 50،000 تراشه H100 Nvidia دارد ، اما نمی تواند در مورد آن صحبت كند ، زیرا قوانین تجاری ایالات متحده خرید این تراشه ها را برای شركت های چینی ممنوع كرده است. در پاسخ به این بیانیه ، ایلان مسک فقط یک کلمه را در پلتفرم X (توییتر) نوشت: “بدیهی است.”

دن ایوز: هزینه کم آموزش اطلاعات عمیق است دن ایوز: هزینه کم آموزش اطلاعات عمیق است

جاش کوشنر ، بنیانگذار Thrive Capital و سرمایه گذاران اصلی Openai ، همچنین معتقد است که DePsic ممکن است قوانین تجاری ایالات متحده را نقض کرده باشد. علاوه بر این ، بنیانگذار Oculus ، Palmer Lucky یکی دیگر از چهره های برجسته است که در مورد هزینه اعلام شده کمتر از 6 میلیون دلار در هر Deepseek ابراز تردید کرده است. علاوه بر این ، یک مقام آمریکایی اخیراً گفت که DePsic از فناوری سرقت ایالات متحده استفاده کرده است.

نکته این است که Dipsic از پشتیبانی قوی برخوردار است. این شرکت توسط صندوق سرمایه گذاری High-Flyer چین که 2 میلیارد دلار ارزش دارد حمایت می شود. این احتمال وجود دارد که میلیاردر مشهور بیل آکمان ادعا کند هزینه کم استراتژی عمق یک سطح بالا برای ایجاد سقوط در شرکت هایی مانند Nvidia است.