Deepseek: هر آنچه را که باید در مورد برنامه AI Chatbot بدانید

ارسال توسط Kyle Wiggers

1404-01-15

در 1404-01-15

Deepseek ویروسی شده است.

آزمایشگاه AI AI Deepseek این هفته پس از آن به آگاهی اصلی وارد شد برنامه Chatbot آن به بالای نمودارهای فروشگاه App Apple افزایش یافت (و Google Play نیز). مدل های هوش مصنوعی Deepseek ، که با استفاده از تکنیک های محاسبات آموزش داده شده اند ، تحلیلگران وال استریت را رهبری کرده اند – و تکنسین ها – برای این سؤال که آیا ایالات متحده می تواند رهبری خود را در مسابقه هوش مصنوعی حفظ کند و آیا تقاضا برای تراشه های هوش مصنوعی حفظ خواهد شد.

اما Deepseek از کجا آمده است ، و چگونه اینقدر سریع به شهرت بین المللی رسید؟

منشأ معامله گر Deepseek

Deepseek توسط مدیریت سرمایه High-Flyer ، یک صندوق پرچین کمی چینی که از AI برای اطلاع رسانی تصمیمات تجاری خود استفاده می کند ، پشتیبانی می شود.

علاقه مند لیانگ ونفنگ ونفنگ ، که طبق گزارش ها دانشجویی در دانشگاه ژجیانگ شروع به تجارت کرد ، در سال 2019 مدیریت سرمایه بالا را به عنوان صندوق پرچین راه اندازی کرد و در سال 2019 متمرکز بر توسعه و استقرار الگوریتم های هوش مصنوعی بود.

در سال 2023 ، High-Flyer به عنوان آزمایشگاه اختصاص داده شده به تحقیق در مورد ابزارهای هوش مصنوعی جدا از تجارت مالی خود ، Deepseek را آغاز کرد. این آزمایشگاه با داشتن پرنده بالا به عنوان یکی از سرمایه گذاران خود ، به شرکت خود ، همچنین Deepseek نامیده می شود.

از روز اول ، Deepseek خوشه های مرکز داده خود را برای آموزش مدل ساخت. اما مانند سایر شرکت های هوش مصنوعی در چین ، Deepseek تحت تأثیر ممنوعیت صادرات ایالات متحده در سخت افزار قرار گرفته استبشر برای آموزش یکی از مدل های جدید خود ، این شرکت مجبور شد از تراشه های NVIDIA H800 ، نسخه کمتری از تراشه ، H100 ، در دسترس شرکت های آمریکایی استفاده کند.

گفته می شود تیم فنی Deepseek به Skew Young گفته می شود. شرکت بنا بر گزارش ها به طرز تهاجمی استخدام می شوند محققان AI دکترا از دانشگاه های برتر چین. Deepseek همچنین افراد را بدون هیچ گونه پیشینه علوم رایانه استخدام می کند برای کمک به فناوری خود ، در نیویورک تایمز ، طیف گسترده ای از موضوعات را درک می کند.

مدل های قوی Deepseek

Deepseek در نوامبر 2023 از اولین مدل های خود-Deepseek Coder ، Deepseek LLM و Deepseek Cat-رونمایی کرد.

Deepseek-V2 ، یک سیستم متنی و تحلیلی تصویر با هدف کلی ، در معیارهای مختلف هوش مصنوعی عملکرد خوبی داشت-و اجرای آن بسیار ارزان تر از مدل های قابل مقایسه در آن زمان بود. این رقابت داخلی Deepseek ، از جمله Bytedance و Alibaba را مجبور به کاهش قیمت استفاده برای برخی از مدل های آنها کرد و دیگران را کاملاً آزاد کرد.

Deepseek-v3، که در دسامبر سال 2024 راه اندازی شد ، فقط به شهرت Deepseek اضافه شد.

با توجه به آزمایش معیار داخلی Deepseek ، Deepseek V3 از هر دو مدل قابل بارگیری و در دسترس مانند متا بهتر است للاما و مدل های “بسته” که فقط از طریق API قابل دسترسی هستند ، مانند Openai's GPT-4Oبشر

به همان اندازه چشمگیر مدل “استدلال” R1 Deepseek است. Deepseek ادعا می کند که در ژانویه منتشر شد R1 و همچنین مدل O1 Openai را در معیارهای کلیدی اجرا می کندبشر

R1 به عنوان یک مدل استدلال ، خود را به طور مؤثر بررسی می کند ، که به آن کمک می کند تا از برخی از مشکلات موجود در مدل ها جلوگیری کند. مدل های استدلال برای رسیدن به راه حل ها در مقایسه با یک مدل معمولی غیر فصلی ، کمی بیشتر طول می کشد-معمولاً چند ثانیه طول می کشد. روند صعودی این است که آنها تمایل دارند که در حوزه هایی مانند فیزیک ، علم و ریاضیات قابل اطمینان تر باشند.

با این حال ، نزولی R1 ، Deepseek V3 و مدل های دیگر Deepseek وجود دارد. هوش مصنوعی توسعه یافته چینی ، آنها مشمول هستند معیار توسط تنظیم کننده اینترنت چین برای اطمینان از اینکه پاسخ های آن “ارزشهای اصلی سوسیالیستی را نشان می دهد”. به عنوان مثال ، در برنامه Chatbot Deepseek ، R1 به سؤالات مربوط به میدان Tiananmen یا استقلال تایوان پاسخ نمی دهد.

در ماه مارس ، Deepseek از 16.5 میلیون بازدید پیشی گرفتبشر دیوید کار ، سردبیر SightleWeb ، به TechCrunch گفت: “(f) یا مارس ، Deepseek با وجود دیدن ترافیک 25 ٪ از جایی که در ماه فوریه بود ، بر اساس بازدیدهای روزانه ، در جایگاه دوم قرار دارد.” این هنوز در مقایسه با Chatgpt ، که 500 میلیون کاربر فعال هفتگی در ماه مارس گذشته بود ، کمرنگ است.

یک رویکرد مختل کننده

اگر Deepseek یک مدل تجاری داشته باشد ، دقیقاً مشخص نیست که این مدل چیست. این شرکت محصولات و خدمات خود را بسیار پایین تر از ارزش بازار قیمت می کند – و دیگران را به صورت رایگان از بین می برد. همچنین پول سرمایه گذار را نمی گیرد، با وجود یک تن علاقه VC.

روشی که Deepseek به آن می گوید ، پیشرفت های کارآیی آن را قادر به حفظ رقابت شدید هزینه کرده است. برخی از کارشناسان مشاجره کردن ارقامی که این شرکت ارائه داده است ، با این حال.

به هر صورت ممکن است ، توسعه دهندگان به مدل های Deepseek رفته اند ، که منبع باز نیستند زیرا این عبارت معمولاً درک می شود اما تحت مجوزهای مجاز و مجاز استفاده می شود. به گفته Clem Delangue ، مدیرعامل Hugging Face ، یکی از سیستم عامل هایی که میزبان مدل های Deepseek است ، توسعه دهندگان در بغل کردن چهره بیش از 500 مدل “مشتق” R1 ایجاد کرده اند این تعداد 2.5 میلیون بار در کنار هم جمع شده است.

موفقیت Deepseek در برابر رقبای بزرگتر و تثبیت شده تر بوده است به عنوان “AI در حال افزایش” توصیف شده است وت “بیش از حد.” موفقیت این شرکت حداقل تا حدودی مسئول بود باعث کاهش قیمت سهام Nvidia 18 ٪ در ژانویه ، و برای ایجاد یک پاسخ عمومی از مدیرعامل OpenAi سام آلتمن. در ماه مارس ، دفاتر وزارت بازرگانی ایالات متحده به کارمندان گفتند که Deepseek در دستگاه های دولتی خود ممنوع خواهد شد، طبق رویترز.

مایکروسافت اعلام کرد که Deepseek در سرویس ریخته گری Azure AI موجود است، پلت فرم مایکروسافت که خدمات AI را برای شرکت ها در زیر یک پرچم واحد جمع می کند. مدیرعامل مارک زاکربرگ گفت: وقتی از تأثیر Deepseek در هزینه های AI Meta در تماس با درآمد سه ماهه اول خود سؤال شد هزینه برای زیرساخت های هوش مصنوعی همچنان “مزیت استراتژیک” خواهد بود برای متا در ماه مارس ، Openai Deepseek را “یارانه ای” و “تحت کنترل دولت” خواند. و توصیه می کند که دولت ایالات متحده ممنوعیت مدل های Deepseek را در نظر بگیرد.

در طول تماس درآمد سه ماهه چهارم NVIDIA ، مدیرعامل جنسن هوانگ بر “نوآوری عالی” Deepseek تأکید کرد. گفتن اینکه این و سایر مدل های “استدلال” برای Nvidia عالی هستند زیرا به محاسبات بسیار بیشتری احتیاج دارند.

در همان زمان ، برخی از شرکت ها در حال ممنوعیت Deepseek هستند، و همچنین کل هستند کشورها وت دولتبا از جمله کره جنوبیبشر ایالت نیویورک نیز Deepseek را از استفاده در دستگاه های دولتی ممنوع کردبشر

در مورد آنچه آینده Deepseek ممکن است داشته باشد ، مشخص نیست. مدل های بهبود یافته داده شده اند. اما به نظر می رسد دولت ایالات متحده است با احتیاط نسبت به آنچه که آن را به عنوان نفوذ خارجی مضر می داندبشر در ماه مارس ، وال استریت ژورنال گزارش داد ایالات متحده احتمالاً Deepseek را در دستگاه های دولتی ممنوع خواهد کردبشر

این داستان در ابتدا 28 ژانویه 2025 منتشر شد و به طور مرتب به روز می شود.

.

منبع

ترجمه شده توسط هوش مصنوعی گوگل