نسل تازه هوش مصنوعی دیپ سیک احتمالا 97 درصد مقرون به صرفه تر از GPT، 4 است

به گزارش مجله آیرخ، خبرهایی از چین به گوش می رسد که نشان می دهد شرکت دیپ سیک در تدارک رونمایی از یک مدل هوش مصنوعی نو با نام R2 است. حدس ها حاکی از ان است که این مدل می تواند موج تازه ای در بازار جهانی هوش مصنوعی ایجاد کند، به خصوص که اطلاعات درز نموده از قیمت گذاری بسیار پایین آن خبر می دهند. بر اساس این اطلاعات، هزینه استفاده از دیپ سیک R2 ممکن است تا 97 درصد کمتر از مدل قدرتمند GPT-4 باشد، موضوعی که پتانسیل تغییر معادلات فعلی را دارد.

نسل تازه هوش مصنوعی دیپ سیک احتمالا 97 درصد مقرون به صرفه تر از GPT، 4 است

پیش از این، مدل R1 شرکت DeepSeek توانایی چین را در رقابت با غول های غربی هوش مصنوعی به خوبی نشان داده بود. معرفی R1 تاثیر قابل توجهی بر بازارهای مالی گذاشت و باعث کاهش ارزش سهام شرکت های بزرگ فناوری در آمریکا شد. این اتفاق ثابت کرد که برای توسعه مدل های زبانی بزرگ و پیشرفته، لزوما نیازی به سرمایه گذاری های کلان و سرسام آور، آنطور که شرکت هایی مانند OpenAI ادعا می نمایند، وجود ندارد. حالا، شایعات پیرامون مدل R2، انتظارها را برای مشاهده پیشرفت های بزرگ تر و قابل توجه تر افزایش داده است.

یکی از ویژگی های کلیدی که درباره دیپ سیک R2 مطرح می گردد، بهره گیری آن از معماری پیشرفته MoE یا همان ترکیب متخصصان (Mixture of Experts) است. این معماری احتمالا با استفاده از مکانیزم های دروازه بندی (Gating Mechanisms) نوین یا ترکیبی هوشمندانه از لایه های MoE و لایه های متراکم (Dense Layers) طراحی شده تا بتواند پردازش های محاسباتی سنگین را با کارایی بالاتری مدیریت کند. بعلاوه گفته می گردد تعداد پارامترهای این مدل به حدود 1.2 تریلیون می رسد که تقریبا دو برابر مدل قبلی، یعنی R1، است. این عدد بزرگ، R2 را در کنار مدل های بسیار پیشرفته ای مانند GPT-4 Turbo و Gemini 2.0 Pro گوگل قرار می دهد و نشان از قدرت بالقوه آن دارد.

اما مجذوب کننده ترین بخش شایعات، مربوط به هزینه استفاده از این مدل قدرتمند است. طبق گزارش های غیررسمی، هزینه پردازش هر یک میلیون توکن ورودی در DeepSeek R2 تنها 0.07 دلار و هزینه پردازش هر یک میلیون توکن خروجی حدود 0.27 دلار خواهد بود. این ارقام نشان دهنده کاهشی تقریبا 97 درصدی در مقایسه با هزینه های مدل GPT-4 شرکت OpenAI است. اگر این قیمت گذاری تایید گردد، DeepSeek R2 می تواند به سرعت به یکی از مالی ترین و مجذوب کننده ترین گزینه ها برای کسب وکارها، سازمان ها و توسعه دهندگانی تبدیل گردد که در پی استفاده از هوش مصنوعی پیشرفته با بودجه محدودتر هستند. این کاهش چشمگیر هزینه می تواند دسترسی به فناوری های سطح بالا را دموکراتیک تر کند و تحولی جدی در جنبه های مالی هوش مصنوعی پدید آورد.

نکته دیگری که در خصوص R2 فاش شده، به زیرساخت آموزشی آن مربوط می گردد. ظاهرا فرایند آموزش این مدل با استفاده از تراشه های Ascend 910B ساخت شرکت هواوی انجام گرفته است. DeepSeek توانسته به بهره وری 82 درصدی از این خوشه پردازشی دست پیدا کند که نشان دهنده بهینه سازی های پیروز این شرکت در استفاده از سخت افزار داخلی است. قدرت پردازشی این خوشه در دقت FP16 به 512 پتافلاپس می رسد. این پیروزیت در بهره برداری حداکثری از منابع داخلی و تراشه های چینی، نشان از کوشش DeepSeek برای یکپارچه سازی عمودی زنجیره تامین خود و کاهش وابستگی به تامین نمایندگان خارجی دارد.

البته باید تاکید نمود که تمام این اطلاعات فعلا در حد شایعه و گزارش های تایید نشده باقی می مانند. شرکت دیپ سیک هنوز به طور رسمی این جزئیات را اعلام نکرده است. با این حال، اگر این برآورد ها صحت داشته باشند و DeepSeek R2 با چنین مشخصات و هزینه ای عرضه گردد، بدون شک شاهد یک غافلگیری بزرگ دیگر در عرصه هوش مصنوعی خواهیم بود. چنین مدلی می تواند موازنه قدرت را در بازار تغییر دهد و چالش جدی تری را پیش روی رقبای غربی، به خصوص شرکت های آمریکایی، قرار دهد. باید منتظر ماند و دید که آیا DeepSeek بار دیگر دنیا فناوری را شگفت زده خواهد نمود یا خیر.

منبع: wccftech

منبع: دیجیکالا مگ
انتشار: 8 اردیبهشت 1404 بروزرسانی: 8 اردیبهشت 1404 گردآورنده: ayrokh.ir شناسه مطلب: 2600

به "نسل تازه هوش مصنوعی دیپ سیک احتمالا 97 درصد مقرون به صرفه تر از GPT، 4 است" امتیاز دهید

امتیاز دهید:

دیدگاه های مرتبط با "نسل تازه هوش مصنوعی دیپ سیک احتمالا 97 درصد مقرون به صرفه تر از GPT، 4 است"

* نظرتان را در مورد این مقاله با ما درمیان بگذارید