تاریخ انتشار : چهارشنبه 7 خرداد 1404 - 19:23
37 بازدید
کد خبر : 209071

Deepseek: هر آنچه را که باید در مورد برنامه AI Chatbot بدانید

Deepseek: هر آنچه را که باید در مورد برنامه AI Chatbot بدانید

[ad_1] Deepseek ویروسی شده است. آزمایشگاه هوش مصنوعی چینی Deepseek این هفته پس از آنکه برنامه Chatbot خود به بالای نمودارهای فروشگاه App App (و Google Play نیز) رسید ، به آگاهی اصلی وارد آگاهی اصلی شد. مدل های هوش مصنوعی Deepseek ، که با استفاده از تکنیک های محاسباتی آموزش دیده بودند ، باعث

[ad_1]

Deepseek ویروسی شده است.

آزمایشگاه هوش مصنوعی چینی Deepseek این هفته پس از آنکه برنامه Chatbot خود به بالای نمودارهای فروشگاه App App (و Google Play نیز) رسید ، به آگاهی اصلی وارد آگاهی اصلی شد. مدل های هوش مصنوعی Deepseek ، که با استفاده از تکنیک های محاسباتی آموزش دیده بودند ، باعث شده است که تحلیلگران وال استریت-و تکنسین ها-این سؤال را مطرح کنند که آیا ایالات متحده می تواند رهبری خود را در مسابقه AI حفظ کند و آیا تقاضا برای تراشه های هوش مصنوعی حفظ خواهد شد.

اما Deepseek از کجا آمده است ، و چگونه اینقدر سریع به شهرت بین المللی رسید؟

منشأ معامله گر Deepseek

Deepseek توسط مدیریت سرمایه High-Flyer ، یک صندوق پرچین کمی چینی که از AI برای اطلاع رسانی تصمیمات تجاری خود استفاده می کند ، پشتیبانی می شود.

لیانگ ونفنگ ، علاقه مندان به هوش مصنوعی ، در سال ۲۰۱۵ با همبستگی بالا Flyer را تأسیس کرد. ونفنگ ، که گفته می شود در حالی که دانشجوی دانشگاه ژجیانگ بود ، در سال ۲۰۱۹ مدیریت سرمایه بالایی را به عنوان صندوق حزب راه اندازی کرد و متمرکز بر توسعه و استقرار الگوریتم های هوش مصنوعی بود.

در سال ۲۰۲۳ ، High-Flyer به عنوان آزمایشگاه اختصاص داده شده به تحقیق در مورد ابزارهای هوش مصنوعی جدا از تجارت مالی خود ، Deepseek را آغاز کرد. این آزمایشگاه با داشتن پرنده بالا به عنوان یکی از سرمایه گذاران خود ، به شرکت خود ، همچنین Deepseek نامیده می شود.

از روز اول ، Deepseek خوشه های مرکز داده خود را برای آموزش مدل ساخت. اما مانند سایر شرکت های هوش مصنوعی در چین ، Deepseek تحت تأثیر ممنوعیت صادرات ایالات متحده در سخت افزار قرار گرفته است. برای آموزش یکی از مدل های جدید خود ، این شرکت مجبور شد از تراشه های NVIDIA H800 ، نسخه کمتری از تراشه ، H100 ، در دسترس شرکت های آمریکایی استفاده کند.

گفته می شود تیم فنی Deepseek به Skew Young گفته می شود. بنا بر گزارش ها ، این شرکت به طرز تهاجمی محققان دکترا AI را از دانشگاه های برتر چین استخدام می کند. Deepseek همچنین افراد را بدون هیچگونه پیشینه علوم رایانه استخدام می کند تا به فناوری خود کمک کند تا طیف گسترده ای از موضوعات را در مورد نیویورک تایمز درک کند.

مدل های قوی Deepseek

Deepseek در نوامبر ۲۰۲۳ از اولین مدل های خود-Deepseek Coder ، Deepseek LLM و Deepseek Cat-رونمایی کرد.

Deepseek-V2 ، یک سیستم متنی و تحلیلی تصویر با هدف کلی ، در معیارهای مختلف هوش مصنوعی عملکرد خوبی داشت-و اجرای آن بسیار ارزان تر از مدل های قابل مقایسه در آن زمان بود. این رقابت داخلی Deepseek ، از جمله Bytedance و Alibaba را مجبور به کاهش قیمت استفاده برای برخی از مدل های آنها کرد و دیگران را کاملاً آزاد کرد.

Deepseek-V3 ، که در دسامبر سال ۲۰۲۴ راه اندازی شد ، فقط به شهرت Deepseek افزود.

طبق آزمایش معیار داخلی Deepseek ، Deepseek V3 از هر دو مدل قابل بارگیری و در دسترس مانند Meta's Llama و مدل های “بسته” استفاده می کند که فقط از طریق API قابل دسترسی است ، مانند GPT-4O Openai.

به همان اندازه چشمگیر مدل “استدلال” R1 Deepseek است. Deepseek که در ژانویه منتشر شد ، ادعا می کند R1 و همچنین مدل O1 Openai را در معیارهای کلیدی انجام می دهد.

R1 به عنوان یک مدل استدلال ، خود را به طور مؤثر بررسی می کند ، که به آن کمک می کند تا از برخی از مشکلات موجود در مدل ها جلوگیری کند. مدل های استدلال برای رسیدن به راه حل ها در مقایسه با یک مدل معمولی غیر فصلی ، کمی بیشتر طول می کشد-معمولاً چند ثانیه طول می کشد. روند صعودی این است که آنها تمایل دارند که در حوزه هایی مانند فیزیک ، علم و ریاضیات قابل اطمینان تر باشند.

با این حال ، نزولی R1 ، Deepseek V3 و مدل های دیگر Deepseek وجود دارد. هوش مصنوعی توسعه یافته چینی ، آنها توسط تنظیم کننده اینترنت چین در معرض معیار قرار گرفته اند تا اطمینان حاصل کنند که پاسخ های آن “ارزشهای اصلی سوسیالیستی را نشان می دهد”. به عنوان مثال ، در برنامه Chatbot Deepseek ، R1 به سؤالات مربوط به میدان Tiananmen یا استقلال تایوان پاسخ نمی دهد.

در ماه مارس ، Deepseek از ۱۶.۵ میلیون بازدید پیشی گرفت. “[F]یا مارس ، Deepseek با وجود دیدن ترافیک ۲۵ ٪ از جایی که در ماه فوریه بود ، بر اساس بازدیدهای روزانه ، در جایگاه دوم قرار دارد. “

در ماه مه ، Deepseek نسخه به روز شده ای از مدل AI استدلال R1 خود را بر روی سکوی توسعه دهنده بغل کردن چهره منتشر کرد.

یک رویکرد مختل کننده

اگر Deepseek یک مدل تجاری داشته باشد ، دقیقاً مشخص نیست که این مدل چیست. این شرکت محصولات و خدمات خود را بسیار پایین تر از ارزش بازار قیمت می کند – و دیگران را به صورت رایگان از بین می برد. علی رغم یک تن از علاقه VC ، این سرمایه گذار نیز نمی گیرد.

روشی که Deepseek به آن می گوید ، پیشرفت های کارآیی آن را قادر به حفظ رقابت شدید هزینه کرده است. با این حال برخی از کارشناسان با ارقام شرکت ارائه داده اند.

به هر صورت ممکن است ، توسعه دهندگان به مدل های Deepseek رفته اند ، که منبع باز نیستند زیرا این عبارت معمولاً درک می شود اما تحت مجوزهای مجاز و مجاز استفاده می شود. به گفته Clem Delangue ، مدیرعامل Hugging Face ، یکی از سیستم عامل هایی که میزبان مدل های Deepseek است ، توسعه دهندگان Face Face بیش از ۵۰۰ مدل “مشتق” R1 را ایجاد کرده اند که ۲.۵ میلیون بار بارگیری شده است.

موفقیت Deepseek در برابر رقبای بزرگتر و تثبیت شده به عنوان “افزایش هوش مصنوعی” و “بیش از حد” توصیف شده است. موفقیت این شرکت حداقل تا حدودی مسئولیت باعث کاهش قیمت سهام NVIDIA در ژانویه ۱۸ ٪ و برای انتخاب پاسخ عمومی از مدیر عامل OpenAi سام آلتمن بود. در ماه مارس ، دفاتر وزارت بازرگانی ایالات متحده به کارمندان گفت که طبق گفته رویترز ، Deepseek در دستگاه های دولتی آنها ممنوع خواهد شد.

مایکروسافت اعلام کرد که Deepseek در سرویس ریخته گری Azure AI ، پلت فرم مایکروسافت موجود است که خدمات AI را برای شرکت ها در زیر یک پرچم واحد جمع می کند. مدیرعامل مارک زاکربرگ ، مدیر عامل شرکت ، گفت که هزینه های زیرساخت های هوش مصنوعی همچنان “مزیت استراتژیک” برای متا خواهد بود. در ماه مارس ، Openai Deepseek را “یارانه ای” و “تحت کنترل دولت” خواند و توصیه می کند که دولت ایالات متحده ممنوعیت مدل های Deepseek را در نظر بگیرد.

در طول تماس درآمد سه ماهه چهارم NVIDIA ، مدیرعامل جنسن هوانگ بر “نوآوری عالی” Deepseek تأکید کرد و گفت که این و سایر مدلهای “استدلال” برای Nvidia عالی هستند زیرا آنها به محاسبه بسیار بیشتری نیاز دارند.

در عین حال ، برخی از شرکت ها در حال ممنوعیت Deepseek هستند ، و کل کشورها و دولت ها از جمله کره جنوبی نیز چنین هستند. ایالت نیویورک همچنین از Deepseek در دستگاه های دولتی استفاده کرد.

در ماه مه ، معاون رئیس جمهور مایکروسافت و رئیس جمهور برد اسمیت در جلسه سنا گفتند که کارمندان مایکروسافت به دلیل امنیت داده ها و نگرانی های تبلیغاتی مجاز به استفاده از Deepseek نیستند.

در مورد آنچه آینده Deepseek ممکن است داشته باشد ، مشخص نیست. مدل های بهبود یافته داده شده اند. اما به نظر می رسد که دولت ایالات متحده نسبت به آنچه که آن را نفوذ خارجی مضر می داند ، در حال رشد است. در ماه مارس ، وال استریت ژورنال گزارش داد که ایالات متحده احتمالاً Deepseek را در دستگاه های دولتی ممنوع خواهد کرد.

این داستان در ابتدا ۲۸ ژانویه ۲۰۲۵ منتشر شد و به طور مرتب به روز می شود.

[ad_2]

منبع:techcrunch

برچسب ها :

ناموجود
ارسال نظر شما
مجموع نظرات : 0 در انتظار بررسی : 0 انتشار یافته : ۰
  • نظرات ارسال شده توسط شما، پس از تایید توسط مدیران سایت منتشر خواهد شد.
  • نظراتی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • نظراتی که به غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نخواهد شد.