مایکروسافت و انویدیا قدرتمندترین مدل زبانی یکپارچه دنیا را

0
مایکروسافت و انویدیا قدرتمندترین مدل زبانی یکپارچه دنیا را ایجاد کردند
مایکروسافت با همکاری انویدیا، مدل زبانی قدرتمندی با ۱۰۵ لایه‌ و ۵۳۰ میلیارد پارامتر ایجاد کرده؛ این مدل زبانی مجهز به ۲۸۰ پردازنده گرافیکی A100 انویدیا است.
انویدیا و مایکروسافت ۲۰ مهر ۱۴۰۰ ادعا می‌کنند که بزرگ‌ترین و قدرتمند‌ترین مدل زبانی یکپارچه موجود را با عنوان مدل تولید زبان طبیعی مگاترون تورینگ (Megatron-Turing Natural Language Generation) ایجاد کرده‌اند.
مدل زبانی، مدلی برای تمایز بین کلمات و عباراتی است که در گفتار ممکن است مشابه به نظر برسند؛ به‌عنوان مثال، در انگلیسی عبارات «recognize speech» و «wreck a nice beach» تقریبا شبیه به هم تلفظ می‌شوند؛ اما معانی مختلفی دارند.
از مدل‌های زبانی در تشخیص گفتار، ترجمه‌های ماشینی، تجزیه و تحلیل دستورهای گفتاری برای دستگاه‌های هوشمند، تشخیص دست خط، بازیابی اطلاعات و سایر برنامه‌ها استفاده می‌شود.
مدل‌های زبانی با استفاده از هوش مصنوعی به تشخیص ابهامات گفتاری مانند مثال بالا کمک خواهند کرد.
به گزارش ZDnet، مدل زبانی مگاترون تورینگ، ۱۰۵ لایه و ۵۳۰ میلیارد پارامتر دارد و روی سخت‌افزار ابررایانه‌ای مانند سلین (Selene) اجرا می‌شود.

برای اینکه درک بهتری از قدرت این مدل زبانی داشته باشیم، می‌توان آن را با مدل زبانی GPT-3 مقایسه کرد. GPT-3 مدل زبانی خود‌همبسته‌ای است که از یادگیری عمیق برای تولید محتوای متنی شبیه به انسان استفاده می‌کند؛ این مدل ۱۷۵ میلیارد پارامتر دارد.

مایکروسافت و انویدیا مشخصات این مدل زبانی را این‌گونه توضیح داده‌اند:
هر ماکت این مدل زبانی مجهز به ۲۸۰ پردازنده گرافیکی A100 انویدیا است که هر گره، برش خاص ۸ سویه دارد و در کل گره‌ها ۳۵ مسیر موازی پردازش دیده شده است.

این مدل زبانی روی ۱۵ مجموعه داده با ۳۳۹ میلیارد توکن آموزش دیده و قادر است توضیح بدهد که چرا هرچه مدل‌ بزرگ‌تر باشد برای عملکرد بهتر آموزش کمتری نیاز خواهد داشت.
اما مدل مگاترون تورینگ مانند همه مدل‌های زبانی، در به‌کارگیری هوش مصنوعی با خطاهای سیستماتیکی همراه است.

مایکروسافت و انویدیا درباره مشکلات مدل‌های زبانی گفتند:
مدل‌های قدرتمند زبانی هر روز بیشتر از قبل پیشرفت می‌کنند؛ اما هنوز برخی از خطاهای سیستماتیک وجود دارد. طبق مشاهدات ما، کلیشه‌های زبانی باعث ایجاد این خطاها در هوش مصنوعی به‌کاررفته در مدل زبانی مگاترون تورینگ می‌شوند و ما خود را متعهد می‌دانیم تا راه حلی برای این مشکل ارائه کنیم.
مایکروسافت در سال ۲۰۱۶ (۱۳۹۵) با استفاده از فناوری یادگیری ماشین، فعالیت باتی به نام Tay را در توییتر آغاز کرد تا تعامل آن را با انسان‌ها آزمایش کند؛ اما این بات در کمتر از ۲۴ ساعت، ادبیاتش تغییر و توییت‌هایی نژادپرستانه‌ای منتشر کرد.

اشتراک گذاری:
  • مطالب مرتبط

    

    ارسال مطلب به ایمیل دوستاتون:


    563 بازدید

    0 نظر

    درج: 1 آبان 1400

    توسط: u-120852
    وضعیت: آفلاین
    گروه کاربری: پشتیبانی سایت

    ارسال دیدگاه (0 مورد)

    نام:*
    ایمیل:*
    سوال: نام خلیج جنوبی ایران؟
    پاسخ:*
    در حال حاضر نظری در این مطلب ارسال نشده است.
    کتاب های پرسوال
    کتاب های تیزهوشان
    کتاب های جامع انسانی
    کنکوریوم

    دسته بندی مطالب

    کتاب های تیزهوشان
    کتاب های جامع

    آخرین نظرات ارسالی

    منتشر کنین لطفا سریع تر
    امیدوارم انسان ها هرچه بیشتر دست به دنبال کردن حقایق هستی بزنند
    محمد 1402/08/21 - 18:58
    وافعا عالی مدیر مدرسمون من به نشر مهر و ماه معرفی کرد بسیار عالی
    سلام وقتتون بخیر.....این کتاب اگه سفارش بدیم چند روزه به دستمون
    سلام اسب هاشون رو عوض کردن
    سلام. نوشته کتاب کارآموز ریاضی پنجم موجود نیست . کی دوباره چاپ

    آمار سایت

    کل مطالب: 19971
    کل نظرات: 30149
    کل اعضا: 309817
    جدیدترین عضو: u-359897
    با ما در ارتباط باشید ، منتظر نظرات شما هستیم.
    
    عضویت در خبرنامه ایمیلی :
    برای عضویت در خبرنامه پیامکی، عدد 1 را به 02196884 پیامک کنید.
    رضایت مندی مشتری
    جشنواره وب و موبایل ایران
    جشنواره وب و موبایل ایران
    جشنواره کتاب مجازی
    برند محبوب مصرف کنندگان
    Copyright © 2010 - 2023 Mehromah.ir