مدل AI کوچک جدید AI2 از مدل های مشابه اندازه از Google ، متا بهتر است

[ad_1] به نظر می رسد هفته برای مدل های کوچک هوش مصنوعی. روز پنجشنبه ، AI2 ، مؤسسه تحقیقاتی غیرانتفاعی AI ، OLMO 2 1B ، یک مدل ۱ میلیارد پارامتر را منتشر کرد که AI2 ادعا می کند مدل های مشابه اندازه از Google ، Meta و Alibaba را در چندین معیار ضرب می

[ad_1]

به نظر می رسد هفته برای مدل های کوچک هوش مصنوعی.

روز پنجشنبه ، AI2 ، مؤسسه تحقیقاتی غیرانتفاعی AI ، OLMO 2 1B ، یک مدل ۱ میلیارد پارامتر را منتشر کرد که AI2 ادعا می کند مدل های مشابه اندازه از Google ، Meta و Alibaba را در چندین معیار ضرب می کند. پارامترها ، که گاهی اوقات به عنوان وزنه ها گفته می شود ، مؤلفه های داخلی یک مدل هستند که رفتار آن را راهنمایی می کنند.

OLMO 2 1B تحت مجوز مجاز Apache 2.0 در AI Dev Platform Bugging Face در دسترس است. بر خلاف اکثر مدل ها ، OLMO 2 1B را می توان از ابتدا تکرار کرد. AI2 مجموعه کد و داده (OLMO-MIX-1124 ، Dolmino-Mix-1124) را برای توسعه آن ارائه داده است.

مدل های کوچک ممکن است به اندازه همتایان Behemoth خود قادر نباشند ، اما مهمتر از همه ، آنها برای اجرای آن نیازی به سخت افزار گوشت گاو ندارند. این امر باعث می شود آنها برای توسعه دهندگان و سرگرمی هایی که با محدودیت ماشین های سطح پایین و مصرف کننده رقابت می کنند ، در دسترس باشد.

طی چند روز گذشته ، از خانواده استدلال مایکروسافت گرفته تا Qwen's 2.5 Omni 3B ، یک مدل کوچک از مدل های کوچک پرتاب شده است. بیشتر این موارد – و OLMO 2 1B – به راحتی می توانند روی یک لپ تاپ مدرن یا حتی یک دستگاه تلفن همراه اجرا شوند.

AI2 می گوید که OLMO 2 1B در مجموعه داده های ۴ تریلیون نشانه از منابع موجود ، AI تولید شده و به صورت دستی ایجاد شده است. توکن ها بیت های خام مدل های داده مصرف و تولید می شوند – ۱ میلیون توکن معادل ۷۵۰،۰۰۰ کلمه است.

در معیار اندازه گیری استدلال حسابی ، GSM8K ، OLMO 2 1B بهتر از Gemma 3 1B Google ، Llama 3.2 1B و Alibaba's Qwen 2.5 1.5b است. OLMO 2 1B همچنین عملکرد این سه مدل را در Truthfulqa ، آزمایشی برای ارزیابی دقت واقعی نشان می دهد.

رویداد TechCrunch

برکلی ، کالیفرنیا
|
۵ ژوئن

اکنون

این مدل بر روی نشانه های 4T از داده های با کیفیت بالا ، به دنبال همان پیش فرض استاندارد در بازپخت با کیفیت بالا از مدل های ۷ ، ۱۳ و 32B ما ، پیش ساخته شد. ما بازرسی های میانی را از هر ۱۰۰۰ مرحله آموزش بارگذاری می کنیم.

به مدل پایه دسترسی پیدا کنید: https://t.co/xofywjmo85 pic.twitter.com/7usj6symdl

– ai2 (allen_ai) ۱ مه ۲۰۲۵

AI2 هشدار می دهد که OLMO 2 1B خطرات را به همراه دارد. این سازمان می گوید ، مانند همه مدل های هوش مصنوعی ، می تواند “خروجی های مشکل ساز” از جمله محتوای مضر و “حساس” تولید کند ، و همچنین اظهارات نادرست. به همین دلایل ، AI2 از استقرار OLMO 2 1B در تنظیمات تجاری توصیه می کند.

[ad_2]

منبع:techcrunch

لینک کوتاه

برچسب ها :

ناموجود

ارسال نظر شما

مجموع نظرات : 0 در انتظار بررسی : 0 انتشار یافته : ۰

نظرات ارسال شده توسط شما، پس از تایید توسط مدیران سایت منتشر خواهد شد.
نظراتی که حاوی تهمت یا افترا باشد منتشر نخواهد شد.
نظراتی که به غیر از زبان فارسی یا غیر مرتبط با خبر باشد منتشر نخواهد شد.