مدل AI کوچک جدید AI2 از مدل های مشابه اندازه از Google ، متا بهتر است

[ad_1] به نظر می رسد هفته برای مدل های کوچک هوش مصنوعی. روز پنجشنبه ، AI2 ، مؤسسه تحقیقاتی غیرانتفاعی AI ، OLMO 2 1B ، یک مدل ۱ میلیارد پارامتر را منتشر کرد که AI2 ادعا می کند مدل های مشابه اندازه از Google ، Meta و Alibaba را در چندین معیار ضرب می
[ad_1]
به نظر می رسد هفته برای مدل های کوچک هوش مصنوعی.
روز پنجشنبه ، AI2 ، مؤسسه تحقیقاتی غیرانتفاعی AI ، OLMO 2 1B ، یک مدل ۱ میلیارد پارامتر را منتشر کرد که AI2 ادعا می کند مدل های مشابه اندازه از Google ، Meta و Alibaba را در چندین معیار ضرب می کند. پارامترها ، که گاهی اوقات به عنوان وزنه ها گفته می شود ، مؤلفه های داخلی یک مدل هستند که رفتار آن را راهنمایی می کنند.
OLMO 2 1B تحت مجوز مجاز Apache 2.0 در AI Dev Platform Bugging Face در دسترس است. بر خلاف اکثر مدل ها ، OLMO 2 1B را می توان از ابتدا تکرار کرد. AI2 مجموعه کد و داده (OLMO-MIX-1124 ، Dolmino-Mix-1124) را برای توسعه آن ارائه داده است.
مدل های کوچک ممکن است به اندازه همتایان Behemoth خود قادر نباشند ، اما مهمتر از همه ، آنها برای اجرای آن نیازی به سخت افزار گوشت گاو ندارند. این امر باعث می شود آنها برای توسعه دهندگان و سرگرمی هایی که با محدودیت ماشین های سطح پایین و مصرف کننده رقابت می کنند ، در دسترس باشد.
طی چند روز گذشته ، از خانواده استدلال مایکروسافت گرفته تا Qwen's 2.5 Omni 3B ، یک مدل کوچک از مدل های کوچک پرتاب شده است. بیشتر این موارد – و OLMO 2 1B – به راحتی می توانند روی یک لپ تاپ مدرن یا حتی یک دستگاه تلفن همراه اجرا شوند.
AI2 می گوید که OLMO 2 1B در مجموعه داده های ۴ تریلیون نشانه از منابع موجود ، AI تولید شده و به صورت دستی ایجاد شده است. توکن ها بیت های خام مدل های داده مصرف و تولید می شوند – ۱ میلیون توکن معادل ۷۵۰،۰۰۰ کلمه است.
در معیار اندازه گیری استدلال حسابی ، GSM8K ، OLMO 2 1B بهتر از Gemma 3 1B Google ، Llama 3.2 1B و Alibaba's Qwen 2.5 1.5b است. OLMO 2 1B همچنین عملکرد این سه مدل را در Truthfulqa ، آزمایشی برای ارزیابی دقت واقعی نشان می دهد.
رویداد TechCrunch
برکلی ، کالیفرنیا
|
۵ ژوئن
اکنون
AI2 هشدار می دهد که OLMO 2 1B خطرات را به همراه دارد. این سازمان می گوید ، مانند همه مدل های هوش مصنوعی ، می تواند “خروجی های مشکل ساز” از جمله محتوای مضر و “حساس” تولید کند ، و همچنین اظهارات نادرست. به همین دلایل ، AI2 از استقرار OLMO 2 1B در تنظیمات تجاری توصیه می کند.
[ad_2]
منبع:techcrunch
برچسب ها :
ناموجود- نظرات ارسال شده توسط شما، پس از تایید توسط مدیران سایت منتشر خواهد شد.
- نظراتی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
- نظراتی که به غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نخواهد شد.
ارسال نظر شما
مجموع نظرات : 0 در انتظار بررسی : 0 انتشار یافته : ۰