مایکروسافت و انویدیا قدرتمندترین مدل زبانی یکپارچه دنیا را

0
مایکروسافت و انویدیا قدرتمندترین مدل زبانی یکپارچه دنیا را ایجاد کردند
مایکروسافت با همکاری انویدیا، مدل زبانی قدرتمندی با ۱۰۵ لایه‌ و ۵۳۰ میلیارد پارامتر ایجاد کرده؛ این مدل زبانی مجهز به ۲۸۰ پردازنده گرافیکی A100 انویدیا است.
انویدیا و مایکروسافت ۲۰ مهر ۱۴۰۰ ادعا می‌کنند که بزرگ‌ترین و قدرتمند‌ترین مدل زبانی یکپارچه موجود را با عنوان مدل تولید زبان طبیعی مگاترون تورینگ (Megatron-Turing Natural Language Generation) ایجاد کرده‌اند.
مدل زبانی، مدلی برای تمایز بین کلمات و عباراتی است که در گفتار ممکن است مشابه به نظر برسند؛ به‌عنوان مثال، در انگلیسی عبارات «recognize speech» و «wreck a nice beach» تقریبا شبیه به هم تلفظ می‌شوند؛ اما معانی مختلفی دارند.
از مدل‌های زبانی در تشخیص گفتار، ترجمه‌های ماشینی، تجزیه و تحلیل دستورهای گفتاری برای دستگاه‌های هوشمند، تشخیص دست خط، بازیابی اطلاعات و سایر برنامه‌ها استفاده می‌شود.
مدل‌های زبانی با استفاده از هوش مصنوعی به تشخیص ابهامات گفتاری مانند مثال بالا کمک خواهند کرد.
به گزارش ZDnet، مدل زبانی مگاترون تورینگ، ۱۰۵ لایه و ۵۳۰ میلیارد پارامتر دارد و روی سخت‌افزار ابررایانه‌ای مانند سلین (Selene) اجرا می‌شود.

برای اینکه درک بهتری از قدرت این مدل زبانی داشته باشیم، می‌توان آن را با مدل زبانی GPT-3 مقایسه کرد. GPT-3 مدل زبانی خود‌همبسته‌ای است که از یادگیری عمیق برای تولید محتوای متنی شبیه به انسان استفاده می‌کند؛ این مدل ۱۷۵ میلیارد پارامتر دارد.

مایکروسافت و انویدیا مشخصات این مدل زبانی را این‌گونه توضیح داده‌اند:
هر ماکت این مدل زبانی مجهز به ۲۸۰ پردازنده گرافیکی A100 انویدیا است که هر گره، برش خاص ۸ سویه دارد و در کل گره‌ها ۳۵ مسیر موازی پردازش دیده شده است.

این مدل زبانی روی ۱۵ مجموعه داده با ۳۳۹ میلیارد توکن آموزش دیده و قادر است توضیح بدهد که چرا هرچه مدل‌ بزرگ‌تر باشد برای عملکرد بهتر آموزش کمتری نیاز خواهد داشت.
اما مدل مگاترون تورینگ مانند همه مدل‌های زبانی، در به‌کارگیری هوش مصنوعی با خطاهای سیستماتیکی همراه است.

مایکروسافت و انویدیا درباره مشکلات مدل‌های زبانی گفتند:
مدل‌های قدرتمند زبانی هر روز بیشتر از قبل پیشرفت می‌کنند؛ اما هنوز برخی از خطاهای سیستماتیک وجود دارد. طبق مشاهدات ما، کلیشه‌های زبانی باعث ایجاد این خطاها در هوش مصنوعی به‌کاررفته در مدل زبانی مگاترون تورینگ می‌شوند و ما خود را متعهد می‌دانیم تا راه حلی برای این مشکل ارائه کنیم.
مایکروسافت در سال ۲۰۱۶ (۱۳۹۵) با استفاده از فناوری یادگیری ماشین، فعالیت باتی به نام Tay را در توییتر آغاز کرد تا تعامل آن را با انسان‌ها آزمایش کند؛ اما این بات در کمتر از ۲۴ ساعت، ادبیاتش تغییر و توییت‌هایی نژادپرستانه‌ای منتشر کرد.

اشتراک گذاری:
  • مطالب مرتبط

    

    ارسال مطلب به ایمیل دوستاتون:


    1,075 بازدید

    0 نظر

    درج: 1 آبان 1400

    توسط: u-120852
    وضعیت: آفلاین
    گروه کاربری: پشتیبانی سایت

    ارسال دیدگاه (0 مورد)

    در حال حاضر نظری در این مطلب ارسال نشده است.
    بیست پک
    هوش کمپلکس ششم
    هدیه+خرید
    هدیه+خرید

    دسته بندی مطالب

    هدیه+خرید
    هدیه+خرید

    آخرین نظرات ارسالی

    سلام این کتاب برای کنکور ۱۴۰۴ ویرایش شداه؟
    واقعا این کتاب خیلی به درد بخور بود ممنون از انتشارات مهر و ماه
    سلام وقت بخیر چاپ جدیدش کی میاد؟
    سلام من با این کتاب تونستم تیزهوشان قبول بشم خیلی خوبه
    سلام این کتاب چاپ چه سالی؟
    حسین 1403/05/8 - 07:46
    سلام تفاوت رشته فقه و حقوق با فقه و مبانی حقوق چیه؟!

    آمار سایت

    با ما در ارتباط باشید ، منتظر نظرات شما هستیم.
    
    عضویت در خبرنامه ایمیلی :
    برای عضویت در خبرنامه پیامکی، عدد 1 را به 02196884 پیامک کنید.
    رضایت مندی مشتری
    جشنواره وب و موبایل ایران
    جشنواره وب و موبایل ایران
    جشنواره کتاب مجازی
    برند محبوب مصرف کنندگان
    Copyright © 2010 - 2023 Mehromah.ir