معرفی هوش مصنوعی DeepSeek؛ آیا میتواند با مدلهای برتر رقابت کند؟
یک مدل هوش مصنوعی جدید چینی که توسط استارتاپ مستقر در هانگژو ساخته شده، صنعت هوش مصنوعی آمریکا را با عملکردی بهتر از برخی از مدلهای پیشرو Open AI متحیر کرده است و حالا اپلیکیشن هوش مصنوعی DeepSeek، در صدر فهرست اپلیکیشن های محبوب فروشگاه های اندروید و آی او اس قرار دارد. همه اینها یک سوال حیاتی را مطرح می کند که علیرغم تحریمهای آمریکا علیه پکن برای دسترسی به نیمهرساناهای پیشرفته، آیا چین توانایی رقابت تنگاتنگ با آمریکا در زمینه هوش مصنوعی را دارد؟
مدل R1 جدید دیپسیک که هفته گذشته با هزینه ای بالغ بر ۶ میلیون دلار برای آموزش منتشر شد، توانست در یک سری از معادلات و استدلال های ریاضی، با هوش مصنوعی های آمریکایی مانند: Chat GPT که حاصل چندین میلیارد دلار سرمایه گذاری از طرف مایکروسافت است رقابت کند و عملکرد خود را به رخ آنها بکشد.
حالا این هوش مصنوعی ارزان قیمت که برای کاربران نیز مقرون بصرفه است توانسته تا با 5 درصد از هزینه سرمایه گذاری پروژه Open AI به یک رقیب ارزان و قدرتمند تبدیل شود و همین دلایل نیز باعث شده اند تا آمریکا نسبت به این موضوع ابراز نگرانی کند. پس از موفقیت هوش مصنوعی DeepSeek ارزش کمپانی انویدیا با کاهش قابل توجهی مواجه شد اما در آن طرف داستان، اطلاعات منتشر شده حاکی از این هستند که عملکرد این هوش مصنوعی روی پردازنده های سری M اپل تا 30 درصد بهتر از رقبا است.
با اینکه عملکرد منحصربفرد این هوش مصنوعی در مقایسه با رقبا موجب شد تا دهان بسیاری از فعالان حوزه فناوری باز بماند، اما بعضی از متخصصان بر این باور هستند که در کنار ویژگی های مثبت هوش مصنوعی DeepSeek، این هوش مصنوعی با ضعف در بخش امنیت مواجه است که کاربران از آن آگاه نیستند. براساس اطلاعات منتشر شده، این هوش مصنوعی اطلاعات مهم و غیرقانونی را در اختیار کاربران قرار می دهد که در سایر انواع هوش مصنوعی، از در اختیار گذاشتن آنها جلوگیری می شود.
مارک اندریسن، سرمایهدار برجسته آمریکایی، در شبکه اجتماعی X نوشت: «دیپسیک R1 لحظه اسپوتنیک هوش مصنوعی است.» او به لحظهای در جنگ سرد اشاره کرد که اتحاد جماهیر شوروی موفق شد تا ماهوارهای را جلوتر از ایالات متحده در مدار قرار دهد. با اینکه نام هوش مصنوعی DeepSeek مانند بمب ترکید و به وفور در شبکه های اجتماعی و اینترنت دیده می شود، اما بعضی از کاربران اطلاعات نسبتا محدودی درباره ی آن دارند. به همین دلیل، در این مقاله می خواهیم تا اطلاعات کاربردی را درباره این هوش مصنوعی چینی در اختیار شما قرار دهیم.
هوش مصنوعی DeepSeek چیست؟
هوش مصنوعی DeepSeek کمتر از دو سال پیش توسط High Flyer به عنوان یک آزمایشگاه تحقیقاتی اختصاص داده شده به حوزه هوش مصنوعی عمومی یا AGI تأسیس شد. مجموعهای از نسخههای متنباز از جمله مدل زبانی بزرگ “v3” که از همه LLMهای متنباز متا بهتر عمل کرد و با GPT4-o استارتاپ OpenAI به رقابت پرداخت، در اواخر سال ۲۰۲۴ این استارتاپ را بر سر زبانها انداختند.
در آن زمان، «لیانگ ونفنگ» که نقش مدیرعامل را ایفا می کرد، در قالب گزارش اعلام کرد که محققان جوان علوم کامپیوتر را با این ایده که «سختترین سؤالات جهان را حل کنند» استخدام کرده است و این هدف او اغلب به منظور افزایش آگاهی جوامع بشری است تا کسب سود بیشتر. از اینرو، سرمایه گذاری های چین روی هوش مصنوعی DeepSeek با نتایج مثبتی همراه بود و محصولات او آنقدر کارآمد بودند که نسخههای منتشر شده دیپسیک در سال ۲۰۲۴ جنگ قیمت را در صنعت هوش مصنوعی دنیا برانگیخت و رقبا را مجبور به کاهش قیمتها کرد.
با این حال، هوش مصنوعی دیپسیک از رقبای آمریکایی خود از یک جنبه مهم و خاص متفاوت است. علیرغم عملکرد شگفت انگیز این هوش مصنوعی در آزمونهای استدلال، مدلهای دیپسیک توسط سیاستهای محدودکننده چین در مورد انتقاد از حزب کمونیست حاکم چین (CCP) محدود شدهاند. به عنوان نمونه، دیپسیک R1 از پاسخ دادن به سؤالات مربوط به کشتار میدان تیانانمن، پکن، در سال ۱۹۸۹ خودداری میکند و این مدل در پاسخ به سؤال رسانه TIME گفت: «متاسفم، این فراتر از محدوده فعلی من است. بیایید در مورد چیز دیگری صحبت کنیم.»
نوآوری در آموزش هوش مصنوعی DeepSeek
هوش مصنوعی DeepSeek از رویکردی متفاوت برای آموزش مدلهای R1 خود نسبت به آنچه توسط OpenAI استفاده میشود، استفاده میکند. این آموزش شامل زمان کمتر، شتابدهندههای هوش مصنوعی کمتر و هزینه توسعه کمتری بود. هدف هوش مصنوعی DeepSeek دستیابی به هوش مصنوعی عمومی است و پیشرفتهای این شرکت در قابلیتهای استدلال، نمایانگر توسعه روزافزون هوش مصنوعی است.
در یک مقاله تحقیقاتی، نوآوری های شناسایی شده در هوش مصنوعی DeepSeek استخراج شده است که شامل موارد زیر هستند:
- یادگیری تقویت شده: دیپسیک از یک رویکرد یادگیری تقویتی در مقیاس بزرگ برای وظایفی مانند: استدلال استفاده میکند.
- Reward engineering: مهندسی پاداش، فرآیند طراحی یک سیستم انگیزشی است که یادگیری یک مدل هوش مصنوعی را در طول آموزش محقق میکند.
- Distillation: محققان دیپسیک با استفاده از تکنیکهای انتقال دانش، به هوش مصنوعی های کوچکتر این اجازه را میدهند تا از اطلاعات و منابع مدل های بزرگتر استفاده کنند و در این زمینه پیشرفت کنند.
- رفتار نوظهور (Emergent Behavior): به الگوها یا رفتارهای پیچیدهای گفته میشود که از تعامل عوامل سادهتر در یک سیستم به وجود میآیند، بدون اینکه این الگوها از قبل در عوامل تعریف شده باشند. به عنوان مثال، نحوه تشکیل دستههای پرندگان را در نظر بگیرید. هر پرنده به صورت جداگانه قوانین سادهای را دنبال میکند، اما از تعامل این پرندگان با یکدیگر، الگوهای پیچیدهای مانند تغییر جهت دسته به صورت هماهنگ شکل میگیرد
- تاثیر آینده هوش مصنوعی بر صنعت بازیهای ویدیویی
هوش مصنوعی DeepSeek چیست؟
از زمان تأسیس این شرکت در سال ۲۰۲۳، دیپسیک مجموعهای از مدلهای هوش مصنوعی مولد را منتشر کرده است و این شرکت با هر نسل جدید، تلاش کرده تا قابلیتها و عملکرد مدلهای خود را بهبود بخشد.
-
دیپسیک کُدِر (DeepSeek Coder): این مدل زبانی، اولین مدل متن باز هوش مصنوعی DeepSeek است که در ماه نوامبر 2023 و برای وظایفی مانند برنامه نویسی ساخته شد.
-
دیپسیک LLM (DeepSeek LLM): این مدل زبانی که در سال 2023 معرفی شد، اولین مدل چند منظوره دیپ سیک است.
-
دیپسیک-V2 (DeepSeek-V2): مدل زبانی V2، نسخه دوم LLM دیپ سیک است که به منظور کاهش هزینههای آموزش و عملکرد قویتر در ماه می سال 2024 معرفی شد.
-
دیپسیک-کُدِر-V2 (DeepSeek-Coder-V2): این مدل زبانی متشکل از 336 میلیارد پارامتر و طول متن 128000 است که برای تسهیل در حل کردن چالشهای برنامهنویسی ساخته شده است.
-
دیپسیک-V3 (DeepSeek-V3): مدل زبانی V3 بر مبنای معماری Mixture of Experts ساخته شده و قادر به انجام طیف گستردهای از وظایف است. این مدل زبانی دارای 671 میلیارد پارامتر و طول متن 128000 است.
-
دیپسیک-R1 (DeepSeek-R1): این مدل زبانی که در ماه ژانویه 2025 و براساس مدل V3 ساخته شده، بر وظایف مرتبط به استدلال تمرکز میکند. مدل R یکی از مهمترین رقبای مدل Open AI است که هزینه بسیار کمتری برای ساخت آن صرف شده است، اما دارای ۶۷۱ میلیارد پارامتر با طول متن ۱۲۸۰۰۰ است.
-
Janus-Pro-7B: این مدل زبانی در سال 2025 منتشر شد و یک مدل بصری است که میتواند تصاویر را درک کند و تصویر مورد نظر کاربر را تولید کند.
رابطه موفقیت DeepSeek و شرکت های آمریکایی
در لحظهای که گوگل، متا، مایکروسافت، آمازون و دهها رقیب این شرکت چینی آمادهاند تا دهها میلیارد دلار دیگر برای زیرساختهای جدید هوش مصنوعی هزینه کنند، موفقیت دیپسیک سؤال نگرانکنندهای را مطرح کرده است: آیا شرکتهای فناوری چینی میتوانند به طور بالقوه با صرف هزینه بسیار کمتر، با توانایی فنی خود برابری کنند یا حتی از آن فراتر روند؟
وبسایت خبری و فناوری The Information گزارش داد که متا قصد دارد امسال ۶۵ میلیارد دلار برای زیرساختهای هوش مصنوعی هزینه کند و در این بین، مدلهای هوش مصنوعی DeepSeek را نیز مورد تجزیه و تحلیل قرار داده است. متا به دنبال این است که چگونه این شرکت چینی توانسته مدلی را به این ارزانی آموزش دهد و قصد دارد تا از روشهای این شرکت چینی برای بهبود مدلهای متنباز Llama استفاده کند. در بازارهای مالی، به دلیل ترس از نیاز کمتر به تراشههای هوش مصنوعی برای آموزش هوش مصنوعی قدرتمند، قیمت سهام انویدیا بیش از ۱۵ درصد کاهش یافت و سهام سایر شرکتهای حوزه فناوری نیز کاهش یافت.
لوکا پائولینی، استراتژیست ارشد Pictet میگوید:
در حالی که دیپسیک R1 خبر خوبی برای کاربران و اقتصاد جهانی است، خبر بدی برای سهام فناوری ایالات متحده نیز محسوب میشود. این موضوع میتواند منجر به کاهش سرمایهگذاری در هوش مصنوعی و فشار بر حاشیههای سود شود. به ویژه، در شرایطی که انتظارات از ارزشگذاری و رشد این سهام بسیار بالا است.
در حال حاضر، مدل “o1 پرو” OpenAI همچنان پیشرفتهترین مدل در سطح جهانی محسوب میشود. با این وجود، عملکرد دیپسیک R1 نشان میدهد که چین در زمینه هوش مصنوعی بسیار سریعتر از آنچه تصور میشد، پیشرفت میکند و مدلهای متنباز تقریباً به سطح مدلهای بسته (Proprietary) رسیدهاند.
برای شرکتهایی مانند OpenAI و گوگل که مدلهایشان به صورت بسته عرضه میشوند، میزان هزینه بسیار پایین دیپسیک برای دسترسی کاربران به پیشرفتهترین مدلهایش نگران کننده است. در حالی که OpenAI برای خروجی هر میلیون توکن ، ۶۰ دلار دریافت میکند، دیپسیک برای همین تعداد توکن از R1، تنها ۲.۱۹ دلار هزینه میگیرد که تقریباً ۳۰ برابر کمتر است.
به گفته ادوارد هریس، مدیر ارشد فناوری Gladstone AI، یک شرکت هوش مصنوعی که از نزدیک با دولت آمریکا همکاری میکند، این اقدام، بنیان صنعت را نابود میکند، حاشیههای سود را از بین میبرد و انگیزه سرمایهگذاری بیشتر در توسعه هوش مصنوعی غربی از منابع بخش خصوصی را با نابودی مواجه میکند.
انتشار مدل DeepSeek-R1 سر و صدای زیادی به پا کرد، اما در ایالات متحده باعث نگرانی و فروش سهام شرکتهای فناوری شد. روز دوشنبه، ۲۷ ژانویه ۲۰۲۵، شاخص نزدک که نشاندهنده وضعیت کلی بازار سهام شرکتهای فناوری است، در ابتدای معاملات ۳.۴ درصد کاهش یافت، سهام شرکت Nvidia که یکی از بزرگترین تولیدکنندگان تراشههای هوش مصنوعی است، ۱۷ درصد افت کرد و تقریباً ۶۰۰ میلیارد دلار از ارزش بازار خود را از دست داد.
به عبارت دیگر، خبر مربوط به DeepSeek-R1 باعث ترس و نگرانی در بین سرمایهگذاران و فعالان بازار سهام شد و آنها شروع به فروش سهام خود کردند. این موضوع منجر به کاهش ارزش سهام شرکتهای فناوری، به ویژه Nvidia، شد و شاخص نزدک نیز افت قابل توجهی را تجربه کرد.
براساس دلایل زیر، هوش مصنوعی DeepSeek زنگ خطر استراتژیهای کارشناسان این حوزه در آمریکا را به خطر انداخت.
- اختلال در هزینه: دیپسیک ادعا میکند که مدل R1 خود را با کمتر از ۶ میلیون دلار توسعه داده است. توسعه کمهزینه، مدل کسبوکار شرکتهای فناوری ایالات متحده را که میلیاردها دلار در هوش مصنوعی سرمایهگذاری کردهاند، تهدید میکند. دیپسیک همچنین برای کاربران ارزانتر از OpenAI است.
- دستاورد فنی علیرغم محدودیتها: صادرات شتابدهنده هوش مصنوعی و تراشههای GPU از ایالات متحده به چین محدود شده است. با این وجود، دیپسیک نشان داد که توسعه هوش مصنوعی پیشرو و بدون دسترسی به پیشرفتهترین فناوری ایالات متحده امکانپذیر است.
- تهدید مدل کسبوکار: برخلاف OpenAI، که یک فناوری اختصاصی است، دیپسیک متنباز و رایگان است و مدل درآمد شرکتهای ایالات متحده را که برای خدمات هوش مصنوعی هزینههای ماهانه دریافت میکنند، به چالش میکشد.
- نگرانیهای ژئوپلیتیکی: زادگاه دیپسیک در چین واقع شده و همین باعث نگرانی فعالان حوزه هوشمصنوعی شده است. مارک اندریسن، سرمایهگذار فناوری، آن را “لحظه اسپوتنیک” هوش مصنوعی نامید و آن را با پیشرفت مسابقه فضایی اتحاد جماهیر شوروی در دهه ۱۹۵۰ مقایسه کرد.
موفقیت دیپسیک زمانی بولدتر شد که اثربخشی استراتژی دولت ایالات متحده برای محدود کردن اکوسیستم هوش مصنوعی چین و محدود کردن صادرات تراشههای قدرتمند یا GPUها به پکن زیر سؤال رفت. اگر ادعاهای دیپسیک درست باشد، به این معناست که چین علیرغم این محدودیتها، توانایی ایجاد مدلهای هوش مصنوعی قدرتمند را دارد و محدودیتهای استراتژی ایالات متحده را بیاثر میکند.
دیپسیک مدعی است که محدودیت اصلی آن، دسترسی به تراشههای سختافزاری بوده، نه کمبود بودجه یا نیروی متخصص. این شرکت اعلام کرده که مدلهای v3 و R1 خود را تنها با استفاده از ۲۰۰۰ تراشه Nvidia نسل دوم آموزش داده است. لیانگ ونفنگ، مدیرعامل دیپسیک، در سال ۲۰۲۴ اظهار داشت: «پول هیچوقت برای ما مسئلهای نبوده است؛ مشکل، ممنوعیت ارسال تراشههای پیشرفته است.» (سیاست فعلی ایالات متحده، صادرات پیشرفتهترین تراشههای هوش مصنوعی، مانند تراشههای مورد استفاده در مراکز داده OpenAI و مایکروسافت به چین را غیرقانونی اعلام کرده است.
با این حال، درستی این ادعاها بستری برای تردید است. الکساندر وانگ، مدیرعامل شرکت Scale AI، اخیراً در داووس به شبکه CNBC گفت: “برداشت من این است که دیپسیک ۵۰ هزار پردازنده H100 در اختیار دارد.” او به پیشرفتهترین تراشههای گرافیکی Nvidia که در حال حاضر در بازار موجود است، اشاره کرد. علاوهبراین، جمعآوری یک خوشه پردازنده برای چنین اهدافی ملزم به هزینههای میلیاردی است.
به عنوان نشانهای از اینکه حزب کمونیست چین چقدر این فناوری را جدی میگیرد، لیانگ، مدیرعامل دیپسیک، دوشنبه گذشته در پکن با لی چیانگ، نخستوزیر چین، دیدار کرد. براساس گزارشها، لیانگ در آن دیدار به لی گفته است که دیپسیک به تراشههای بیشتری نیاز دارد. جرمی هریس، مدیرعامل Gladstone AI، در رابطه با این موضوع گفت: “دیپسیک فقط به چند هزار GPU دسترسی دارد و با این وجود، میتواند به نیاز کاربران پاسخ دهد.
حتی اگر چین با استفاده از تراشههای کمتر به سطح قابل توجهی از تواناییهای هوش مصنوعی دست یافته باشد، کارشناسان معتقدند که قدرت محاسباتی بیشتر همیشه یک مزیت راهبردی خواهد بود و در این زمینه، ایالات متحده همچنان از مزیت قابل توجهی برخوردار است.
پیشرفت هوش مصنوعی از این نقطه
از دسامبر، مدلهای جدید o1 و o3 شرکت OpenAI رکوردهای آزمونهای استدلال پیشرفته را که برای دشوار بودن برای مدلهای هوش مصنوعی طراحی شدهاند، شکستهاند. دیپسیک R1 کار مشابهی انجام میدهد و در این فرآیند، چیزی را که بسیاری از محققان آن را تغییر پارادایم مینامند، به نمایش میگذارد: به جای افزایش میزان قدرت محاسباتی مورد استفاده برای آموزش مدل، محققان میزان زمان (و در نتیجه، قدرت محاسباتی و برق) مورد استفاده مدل برای فکر کردن در مورد پاسخ به یک پرس و جو قبل از پاسخ دادن را افزایش میدهند.
این افزایش مقیاس چیزی است که محققان آن را «محاسبات زمان آزمون» مینامند که کلاس جدیدی از «مدلهای استدلال»، مانند دیپسیک R1 و o1 OpenAI، را از پیشینیان کمتر پیچیده خود متمایز میکند. بسیاری از محققان هوش مصنوعی معتقدند که هنوز فضای زیادی باقی مانده است تا این پارادایم به محدودیت خود برسد.
برخی از محققان هوش مصنوعی، R1 دیپسیک را با آلفا زیرو دیپمایند، یک مدل ۲۰۱۷ مقایسه کردند. آلفا زیرو توانست با تکرار بازی با خود و یادگیری از اشتباهاتش، به یک بازیکن برتر در بازیهای شطرنج و گو تبدیل شود. این نشان میدهد که هوش مصنوعی میتواند با استفاده از روشهای خودآموزی، به طور چشمگیری در زمینههای مختلف پیشرفت کند.
به عبارت دیگر، محققان دیپسیک به جای اینکه به R1 نحوه حل مسائل را به طور خاص آموزش دهند، راهی را پیدا کردند که به R1 اجازه میدهد تا به طور مستقل تواناییهای استدلال خود را توسعه دهد. آنها این کار را با ارائه «انگیزههای درست» به مدل انجام دادند، که به آن اجازه داد تا به طور خودکار استراتژیهای پیشرفته حل مسئله را توسعه دهد. این رویکرد با روشهای سنتی آموزش LLM متفاوت است، که در آن مدلها روی دادههای برچسبگذاری شده توسط انسان آموزش داده میشوند. در مقابل، R1 از ابتدا یاد میگیرد که چگونه استدلال کند و مسائل را حل کند.
این یافته مهم است زیرا نشان میدهد که قابلیتهای قدرتمند هوش مصنوعی میتوانند سریعتر و با تلاش انسانی کمتر از آنچه قبلاً تصور میشد و فقط با اعمال قدرت محاسباتی بیشتر، ظاهر شوند. براندج معتقد است که چین و ایالات متحده در رقابتی تنگاتنگ برای دستیابی به ابرهوشمندی هستند و چین احتمالاً تا یک سال پس از ایالات متحده به این فناوری دست خواهد یافت. منظور از “ابرهوشمندی” در اینجا، سطحی از هوش مصنوعی است که از هوش انسان فراتر میرود.
نکته مهم در گفته براندج این است که او تأکید میکند این رقابت نباید منجر به جنگ شود. او هشدار میدهد که برای جلوگیری از چنین سناریویی، لازم است از همین حالا برای پیامدهای جهانی که ناشی از ظهور چنین فناوری قدرتمندی است، برنامهریزی و استراتژی داشته باشیم. به عبارت دیگر، باید برای جهانی که در آن چندین قدرت بزرگ به طور همزمان به هوش مصنوعی پیشرفته دسترسی دارند (دنیای چندقطبی هوش مصنوعی) آماده باشیم و بدانیم چگونه این شرایط را مدیریت کنیم.
دیپ سیک در چه کشورهای بن شده است؟
کشورهایی که دیپسیک در آنها ممنوع است عبارتند از:
- آژانسهای دولتی استرالیا
- دولت مرکزی هند
- ایتالیا
- ناسا
- وزارت صنعت کره جنوبی
- آژانسهای دولتی تایوان
- دولت ایالت تگزاس
- کنگره ایالات متحده
- نیروی دریایی ایالات متحده
- پنتاگون ایالات متحده
منبع: Techtarget