محققان آمریکایی از دیپ سیک تقلید کردند

به گزارش وب کنفرانس، تعدادی از پژوهشگران دانشگاهی در آمریکا با اتکا بر مدل هوش مصنوعی دیپ سیک، قابلیت های اصلی این مدل را با هزینه ای ۳۰ دلاری باز تولید کردند.

به گزارش وب کنفرانس به نقل از گیزموچاینا، تحقیقات در رابطه با هوش مصنوعی معمولاً زمین بازی شرکتهای بزرگ فناوری با بودجه های کلان است اما بعد از آنکه شرکت چینی دیپ سیک ادعا نمود با سرمایه ۶ میلیون دلاری یک مدل این فناوری را با قابلیت رقابت با چت جی پی تی توسعه داده، در بازار هیاهویی به وجود آمد. حالا تعدادی از پژوهشگران دانشگاه «یوسی برکلی» قابلیت های اصلی مدل R۱-Zero دیپ سیک را با هزینه ۳۰ دلار تکرار کرده اند. این پروژه که «تاینی زیرو» نام گرفته، نشان داده است برای توسعه مدلهای استدلالی پیشرفته هوش مصنوعی لزوما به هزینه های کلان نیاز نیست. البته باید به این نکته هم اشاره نمود که هوش مصنوعی هم بیشتر از پیش در دسترس قرار گرفته است. تعدادی از پژوهشگران به رهبری «جیای پان» تصمیم گرفتند مدل استدلالی دیپ سیک را با استفاده از فناوری «یادگیری تقویتی» (RL) بازسازی کنند. آنها به جای اتکا روی سرویسهای ابررایانشی یا قدرت رایانشی گرانقیمت، «تاینی زیرو» را با کمک یک مدل زبانی پایه، یک محرک و یک سیستم پاداش ساده آموزش دادند. پان در شبکه اجتماعی ایکس نوشت: شما می توانید خودتان لحظه «آها» (دستیابی به موفقیت) را با ۳۰ دلار تجربه کنید. او توضیح داد تاینی زیرو اولین بازتولید مدلهای استدلالی است که نشان دهنده قابلیت آنها برای تایید و اصلاح پاسخ هایشان است. محققان برای آزمایش مدل از یک بازی به نام «کانت داون» استفاده کردند که بازیکنان آن باید با استفاده از محاسبات پایه ریاضی به رقم مورد نظر دست یابند. هرچند تاینی زیرو در ابتدا به صورت تصادفی پاسخ را حدس می زد، اما به گذر زمان آموخت پاسخ هایش را تایید کند، برای پاسخ های بهتر جستجو انجام دهد و برپایه آن انطباقاتی انجام دهد. آنها در آزمایش هایشان از مدلهای هوش مصنوعی با اندازه مختلف از ۵۰۰ میلیون تا ۷ میلیارد پارامتر استفاده کردند نتایج نشان داد مدلهای کوچکتر بعد از حدس زدن پاسخ، متوقف می شدند. اما مدلهای بزرگ خودتاییدی، بهبود چاره ها را آموختند و دقت را به میزان قابل توجهی بالا بردند. تاینی زیرو یک مدل هوش مصنوعی منبع باز است و کاربران در گیت هاب می توانند به آن دسترسی یابند. هرچند این مدل هم اکنون فقط روی بازی کانت داون آزمایش شده اما پان امیدوار است این پروژه تحقیقات یادگیری تقویتی را بیشتر از پیش در دسترس قرار دهد.

1403/11/14

10:05:55

5.0 / 5

250

تگهای خبر: آموزش , پژوهش , تجربه , تحقیقات

این مطلب را می پسندید؟

(1)

(0)

تازه ترین مطالب مرتبط

نظرات بینندگان در مورد این مطلب

لطفا شما هم در مورد این مطلب نظر دهید

= ۲ بعلاوه ۳

ارسال نظر

محققان آمریکایی از دیپ سیک تقلید کردند

وب كنفرانس