Deepseek: هر آنچه را که باید در مورد برنامه AI Chatbot بدانید

ارسال توسط Kyle Wiggers

1403-11-10

در 1403-11-10

Deepseek ویروسی شده است.

آزمایشگاه AI AI Deepseek این هفته پس از آن به آگاهی اصلی وارد شد برنامه Chatbot آن به بالای نمودارهای فروشگاه App Apple افزایش یافتبشر مدل های هوش مصنوعی Deepseek ، که با استفاده از تکنیک های محاسبات آموزش داده شده اند ، تحلیلگران وال استریت را رهبری کرده اند – و تکنسین ها – برای این سؤال که آیا ایالات متحده می تواند رهبری خود را در مسابقه هوش مصنوعی حفظ کند و آیا تقاضا برای تراشه های هوش مصنوعی حفظ خواهد شد.

اما Deepseek از کجا آمده است ، و چگونه اینقدر سریع به شهرت بین المللی رسید؟

منشأ معامله گر Deepseek

Deepseek توسط مدیریت سرمایه High-Flyer ، یک صندوق پرچین کمی چینی که از AI برای اطلاع رسانی تصمیمات تجاری خود استفاده می کند ، پشتیبانی می شود.

لیانگ ونفنگ علاقه مندان به AI در سال 2015 با همبستگی بالا Flyer را تأسیس کردند. ونفنگ ، که گفته می شود در حالی که دانشجوی دانشگاه ژجیانگ بود ، در سال 2019 مدیریت سرمایه بالایی را به عنوان صندوق حزب محور راه اندازی کرد و متمرکز بر توسعه و استقرار الگوریتم های هوش مصنوعی بود.

در سال 2023 ، High-Flyer به عنوان آزمایشگاه اختصاص داده شده به تحقیق در مورد ابزارهای هوش مصنوعی جدا از تجارت مالی خود ، Deepseek را آغاز کرد. این آزمایشگاه با داشتن پرنده بالا به عنوان یکی از سرمایه گذاران خود ، به شرکت خود ، همچنین Deepseek نامیده می شود.

از روز اول ، Deepseek خوشه های دیتاسنتر خود را برای آموزش مدل ساخت. اما مانند سایر شرکت های هوش مصنوعی در چین ، Deepseek تحت تأثیر ممنوعیت صادرات ایالات متحده در سخت افزار قرار گرفته استبشر برای آموزش یکی از مدل های جدید خود ، این شرکت مجبور شد از تراشه های NVIDIA H800 ، نسخه کمتری از تراشه ، H100 ، در دسترس شرکت های آمریکایی استفاده کند.

گفته می شود تیم فنی Deepseek به Skew Young گفته می شود. شرکت بنا بر گزارش ها به طرز تهاجمی استخدام می شوند محققان AI دکترا از دانشگاه های برتر چین. Deepseek همچنین افراد را بدون هیچ گونه پیشینه علوم رایانه استخدام می کند برای کمک به فناوری خود ، در نیویورک تایمز ، طیف گسترده ای از موضوعات را درک می کند.

مدل های قوی Deepseek

Deepseek در نوامبر 2023 از اولین مدل های خود-Deepseek Coder ، Deepseek LLM و Deepseek Cat-رونمایی کرد. شروع به توجه کرد.

Deepseek-V2 ، یک سیستم متنی و تحلیلی تصویر با هدف کلی ، در معیارهای مختلف هوش مصنوعی عملکرد خوبی داشت-و اجرای آن بسیار ارزان تر از مدل های قابل مقایسه در آن زمان بود. این رقابت داخلی Deepseek ، از جمله Bytedance و Alibaba را مجبور به کاهش قیمت استفاده برای برخی از مدل های آنها کرد و دیگران را کاملاً آزاد کرد.

Deepseek-v3، که در دسامبر سال 2024 راه اندازی شد ، فقط به شهرت Deepseek اضافه شد.

با توجه به آزمایش معیار داخلی Deepseek ، Deepseek V3 از هر دو مدل قابل بارگیری و در دسترس مانند متا بهتر است للاما و مدل های “بسته” که فقط از طریق API قابل دسترسی هستند ، مانند Openai's GPT-4Oبشر

به همان اندازه چشمگیر مدل “استدلال” R1 Deepseek است. Deepseek ادعا می کند که در ژانویه منتشر شد R1 و همچنین مدل O1 Openai را در معیارهای کلیدی اجرا می کندبشر

R1 به عنوان یک مدل استدلال ، خود را به طور مؤثر بررسی می کند ، که به آن کمک می کند تا از برخی از مشکلات موجود در مدل ها جلوگیری کند. مدل های استدلال برای رسیدن به راه حل ها در مقایسه با یک مدل معمولی غیر فصلی ، کمی بیشتر طول می کشد-معمولاً چند ثانیه طول می کشد. روند صعودی این است که آنها تمایل دارند که در حوزه هایی مانند فیزیک ، علم و ریاضیات قابل اطمینان تر باشند.

با این حال ، نزولی R1 ، Deepseek V3 و مدل های دیگر Deepseek وجود دارد. هوش مصنوعی توسعه یافته چینی ، آنها مشمول هستند معیار توسط تنظیم کننده اینترنت چین برای اطمینان از اینکه پاسخ های آن “ارزشهای اصلی سوسیالیستی را نشان می دهد”. به عنوان مثال ، در برنامه Chatbot Deepseek ، R1 به سؤالات مربوط به میدان Tiananmen یا استقلال تایوان پاسخ نمی دهد.

یک رویکرد مختل کننده

اگر Deepseek یک مدل تجاری داشته باشد ، دقیقاً مشخص نیست که این مدل چیست. این شرکت محصولات و خدمات خود را بسیار پایین تر از ارزش بازار قیمت می کند – و دیگران را به صورت رایگان از بین می برد.

روشی که Deepseek به آن می گوید ، پیشرفت های کارآیی آن را قادر به حفظ رقابت شدید هزینه کرده است. برخی از کارشناسان مشاجره کردن ارقامی که این شرکت ارائه داده است ، با این حال.

به هر صورت ممکن است ، توسعه دهندگان به مدل های Deepseek رفته اند ، که منبع باز نیستند زیرا این عبارت معمولاً درک می شود اما تحت مجوزهای مجاز و مجاز استفاده می شود. به گفته Clem Delangue ، مدیرعامل Hugging Face ، یکی از سیستم عامل هایی که میزبان مدل های Deepseek است ، توسعه دهندگان در بغل کردن چهره بیش از 500 مدل “مشتق” R1 ایجاد کرده اند این تعداد 2.5 میلیون بار در کنار هم جمع شده است.

موفقیت Deepseek در برابر رقبای بزرگتر و تثبیت شده تر بوده است به عنوان “AI در حال افزایش” توصیف شده است وت با استفاده از “دوره جدیدی از آستانه AI”. موفقیت این شرکت حداقل تا حدودی مسئول بود باعث شد قیمت سهام Nvidia در روز دوشنبه 18 ٪ کاهش یابد، و برای ایجاد یک پاسخ عمومی از مدیرعامل OpenAi سام آلتمن.

در مورد آنچه آینده Deepseek ممکن است داشته باشد ، مشخص نیست. مدل های بهبود یافته داده شده اند. اما به نظر می رسد دولت ایالات متحده با احتیاط نسبت به آنچه که آن را به عنوان نفوذ خارجی مضر می داندبشر

TechCrunch دارای یک خبرنامه AI متمرکز است! اینجا ثبت نام کنید تا هر چهارشنبه آن را در صندوق ورودی خود بدست آورید.

.

منبع

ترجمه شده توسط هوش مصنوعی گوگل