خبر خوب برای xAI؛ آیا Grok بالاخره در پاسخ به سوالات Baldur’s Gate از ChatGPT جلو زد؟

آیلین سرهنگی
02 اسفند 1404
9
0

دنیای مدل‌های هوش مصنوعی فقط درباره چت‌بات‌های عمومی و کاربردهای سازمانی نیست؛ گاهی رقابت سر چیزی است که شاید در نگاه اول عجیب به نظر برسد: راهنمای بازی‌های ویدیویی!

طبق گزارشی جدید، شرکت xAI که توسط Elon Musk تأسیس شده و اخیراً توسط SpaceX خریداری شده، تمرکز ویژه‌ای روی بهبود پاسخ‌های چت‌بات خود، یعنی Grok درباره بازی معروف Baldur’s Gate 3 داشته است.

ماجرای تأخیر در انتشار مدل به خاطر یک بازی

طبق گزارش منتشرشده، سال گذشته عرضه یکی از نسخه‌های مدل Grok چند روز به تأخیر افتاد. دلیلش چه بود؟ نارضایتی ایلان ماسک از کیفیت پاسخ‌های چت‌بات درباره جزئیات Baldur’s Gate.

گفته می‌شود حتی مهندسان ارشد از پروژه‌های مهم دیگر کنار کشیده شدند تا پاسخ‌های مربوط به این بازی را بهبود دهند. برای بعضی از مهندسانی که انتظار داشتند روی مسائل بنیادی هوش مصنوعی کار کنند، این موضوع احتمالاً کمی عجیب بوده است.

اما سؤال مهم‌تر اینجاست: آیا این تلاش نتیجه داد؟

مقایسه Grok با ChatGPT، Claude و Gemini

برای بررسی عملکرد Grok، مجموعه‌ای از سوالات عمومی درباره Baldur’s Gate طراحی شد و پاسخ‌های آن با سه مدل بزرگ دیگر مقایسه شد:

  1. ChatGPT
  2. Claude
  3. Gemini

این مقایسه غیررسمی که به شوخی «BaldurBench» نام گرفته، نشان داد Grok واقعاً عملکرد قابل قبولی دارد. پاسخ‌هایش دقیق و کاربردی بودند، هرچند پر از اصطلاحات تخصصی گیمرها مثل DPS یا save-scumming.

از نظر سبک پاسخ‌دهی هم تفاوت‌ها جالب بود:

  1. ChatGPT بیشتر سراغ بولت‌پوینت و پاسخ‌های خلاصه می‌رود.
  2. Gemini علاقه زیادی به بولد کردن کلمات کلیدی دارد.
  3. Claude محتاط‌تر است و حتی نگران اسپویل شدن داستان بازی برای کاربر بود!

Grok هم عاشق جدول و تحلیل‌های تئوریک است؛ دقیقاً همان چیزی که از یک مدل مورد علاقه ایلان ماسک انتظار می‌رود.

چرا این موضوع مهم است؟

شاید در نگاه اول، تمرکز روی پاسخ‌های مربوط به یک بازی ویدیویی موضوعی حاشیه‌ای به نظر برسد. اما از منظر فنی، این مسئله نشان می‌دهد که مدل‌های زبانی بزرگ چگونه در حوزه‌های تخصصی بهینه‌سازی می‌شوند.

وقتی یک شرکت تصمیم می‌گیرد در یک دامنه خاص به «برابری عملکرد» با رقبا برسد، معمولاً یعنی آن حوزه برایش اهمیت استراتژیک دارد. در این مورد، گزارش‌ها نشان می‌دهد xAI مشخصاً روی این بخش کار کرده تا Grok از رقبا عقب نماند.

نتیجه؟ Grok حالا تقریباً هم‌سطح مدل‌های مطرح دیگر در پاسخ به سوالات مربوط به Baldur’s Gate عمل می‌کند.

رقابت مدل‌های هوش مصنوعی وارد فاز جدیدی شده

قبلاً رقابت بین مدل‌ها بیشتر حول توانایی‌های عمومی، کدنویسی یا تولید محتوا بود. حالا اما شاهد رقابت در حوزه‌های خاص و حتی سرگرمی هستیم.

این یعنی:

  1. مدل‌ها به سمت تخصصی‌تر شدن حرکت می‌کنند
  2. معیارهای ارزیابی غیررسمی هم اهمیت پیدا کرده‌اند
  3. رقابت بین OpenAI، Anthropic، گوگل و xAI وارد جزئی‌ترین لایه‌ها شده است

در نهایت، شاید این رقابت از یک بازی شروع شده باشد، اما پیامش روشن است: هر حوزه‌ای که کاربران برایش اهمیت قائل باشند، می‌تواند به میدان جدی رقابت مدل‌های هوش مصنوعی تبدیل شود.


#هوش_مصنوعی #ایلان_ماسک #بازی_ویدیویی #مدل_زبانی


#BaldursGate

#AI #xAI #Grok #ElonMusk #ChatGPT #Claude #Gemini #BaldursGate3

آیلین سرهنگی

آیلین سرهنگی

متخصص حوزه فناوری با تمرکز بر هوش مصنوعی، یادگیری ماشین و زیرساخت‌های نرم‌افزاری، در تیم فنی یک شرکت فعال در زمینه فناوری‌های نوین فعالیت می‌کنم و تلاش دارم تا با تولید محتوای دقیق، کاربردی و به‌روز، مفاهیم پیچیده‌ی تکنولوژی را به زبان ساده برای همه ارائه کنم.
پیشنهاد میشود بخوانید
ورود OpenAI به فاز جدی سازمانی؛ همکاری با BCG، مک‌کنزی و Accenture برای فتح بازار Enterprise AI
05 اسفند 1404
6
0
ورود OpenAI به فاز جدی سازمانی؛ همکاری با BCG، مک‌کنزی و Accenture برای فتح بازار Enterprise AI
آیلین سرهنگی
به نظر می‌رسد OpenAI دیگر فقط به ساخت مدل‌های قدرتمند فکر نمی‌کند؛ حالا هدف بعدی، تسخیر بازار سازمانی در سال ۲۰۲۶ است. ا...

هوش مصنوعی

اتهام سنگین Anthropic به شرکت‌های چینی: آیا Claude هدف استخراج غیرقانونی مدل‌های AI قرار گرفته است؟
05 اسفند 1404
7
0
اتهام سنگین Anthropic به شرکت‌های چینی: آیا Claude هدف استخراج غیرقانونی مدل‌های AI قرار گرفته است؟
آیلین سرهنگی
رقابت هوش مصنوعی وارد فاز تازه‌ای شده؛ فازی که دیگر فقط درباره ساخت مدل قوی‌تر نیست، بلکه درباره این است که چه کسی از چه...

هوش مصنوعی

آیا OpenClaw از کنترل خارج شد؟ ماجرای حذف دسته‌جمعی ایمیل‌های پژوهشگر امنیتی Meta AI
05 اسفند 1404
6
0
آیا OpenClaw از کنترل خارج شد؟ ماجرای حذف دسته‌جمعی ایمیل‌های پژوهشگر امنیتی Meta AI
آیلین سرهنگی
گاهی اوقات یک توییت وایرال بیشتر از ده‌ها مقاله فنی درباره ریسک‌های AI حرف برای گفتن دارد. ماجرا از جایی شروع شد که Summ...

هوش مصنوعی

Canva با خرید استارتاپ‌های انیمیشن و مارکتینگ، به ابرپلتفرم تبلیغات و طراحی تبدیل می‌شود؟
05 اسفند 1404
5
0
Canva با خرید استارتاپ‌های انیمیشن و مارکتینگ، به ابرپلتفرم تبلیغات و طراحی تبدیل می‌شود؟
آیلین سرهنگی
وقتی اسم Canva می‌آید، خیلی‌ها یاد طراحی پست اینستاگرام و ارائه‌های شیک می‌افتند. اما به نظر می‌رسد این شرکت دیگر فقط یک...

هوش مصنوعی

یک پیام بگذارید
نام و نام خانوادگی
آدرس ایمیل
متن نظر

به کمک نیاز دارید؟ با ما تماس بگیرید

کرج عظیمیه طالقانی شمالی کوچه شهید مسعود شجاعی (رز) برج قائم 2 واحد 1

02632558409

09124287589

afrino.co@gmail.com

ما را دنبال کنید
logo-samandehi

تمامی حقوق این سایت محفوظ و متعلق به شرکت "توسعه دانش رایا آفرینش" است.

An error has occurred. This application may no longer respond until reloaded. Reload 🗙