تاریخ انتشار : پنجشنبه 11 اردیبهشت 1404 - 18:42
30 بازدید
کد خبر : 209011

مدل AI کوچک جدید AI2 از مدل های مشابه اندازه از Google ، متا بهتر است

مدل AI کوچک جدید AI2 از مدل های مشابه اندازه از Google ، متا بهتر است

[ad_1] به نظر می رسد هفته برای مدل های کوچک هوش مصنوعی. روز پنجشنبه ، AI2 ، مؤسسه تحقیقاتی غیرانتفاعی AI ، OLMO 2 1B ، یک مدل ۱ میلیارد پارامتر را منتشر کرد که AI2 ادعا می کند مدل های مشابه اندازه از Google ، Meta و Alibaba را در چندین معیار ضرب می

[ad_1]

به نظر می رسد هفته برای مدل های کوچک هوش مصنوعی.

روز پنجشنبه ، AI2 ، مؤسسه تحقیقاتی غیرانتفاعی AI ، OLMO 2 1B ، یک مدل ۱ میلیارد پارامتر را منتشر کرد که AI2 ادعا می کند مدل های مشابه اندازه از Google ، Meta و Alibaba را در چندین معیار ضرب می کند. پارامترها ، که گاهی اوقات به عنوان وزنه ها گفته می شود ، مؤلفه های داخلی یک مدل هستند که رفتار آن را راهنمایی می کنند.

OLMO 2 1B تحت مجوز مجاز Apache 2.0 در AI Dev Platform Bugging Face در دسترس است. بر خلاف اکثر مدل ها ، OLMO 2 1B را می توان از ابتدا تکرار کرد. AI2 مجموعه کد و داده (OLMO-MIX-1124 ، Dolmino-Mix-1124) را برای توسعه آن ارائه داده است.

مدل های کوچک ممکن است به اندازه همتایان Behemoth خود قادر نباشند ، اما مهمتر از همه ، آنها برای اجرای آن نیازی به سخت افزار گوشت گاو ندارند. این امر باعث می شود آنها برای توسعه دهندگان و سرگرمی هایی که با محدودیت ماشین های سطح پایین و مصرف کننده رقابت می کنند ، در دسترس باشد.

طی چند روز گذشته ، از خانواده استدلال مایکروسافت گرفته تا Qwen's 2.5 Omni 3B ، یک مدل کوچک از مدل های کوچک پرتاب شده است. بیشتر این موارد – و OLMO 2 1B – به راحتی می توانند روی یک لپ تاپ مدرن یا حتی یک دستگاه تلفن همراه اجرا شوند.

AI2 می گوید که OLMO 2 1B در مجموعه داده های ۴ تریلیون نشانه از منابع موجود ، AI تولید شده و به صورت دستی ایجاد شده است. توکن ها بیت های خام مدل های داده مصرف و تولید می شوند – ۱ میلیون توکن معادل ۷۵۰،۰۰۰ کلمه است.

در معیار اندازه گیری استدلال حسابی ، GSM8K ، OLMO 2 1B بهتر از Gemma 3 1B Google ، Llama 3.2 1B و Alibaba's Qwen 2.5 1.5b است. OLMO 2 1B همچنین عملکرد این سه مدل را در Truthfulqa ، آزمایشی برای ارزیابی دقت واقعی نشان می دهد.

رویداد TechCrunch

برکلی ، کالیفرنیا
|
۵ ژوئن

اکنون

AI2 هشدار می دهد که OLMO 2 1B خطرات را به همراه دارد. این سازمان می گوید ، مانند همه مدل های هوش مصنوعی ، می تواند “خروجی های مشکل ساز” از جمله محتوای مضر و “حساس” تولید کند ، و همچنین اظهارات نادرست. به همین دلایل ، AI2 از استقرار OLMO 2 1B در تنظیمات تجاری توصیه می کند.



[ad_2]

منبع:techcrunch

برچسب ها :

ناموجود
ارسال نظر شما
مجموع نظرات : 0 در انتظار بررسی : 0 انتشار یافته : ۰
  • نظرات ارسال شده توسط شما، پس از تایید توسط مدیران سایت منتشر خواهد شد.
  • نظراتی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
  • نظراتی که به غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نخواهد شد.