کدام مدل هوش مصنوعی از بقیه باهوش‌تر است؟ مقایسه بر اساس تست IQ + جدول

کدام مدل هوش مصنوعی از بقیه باهوش‌تر است؟ مقایسه بر اساس تست IQ + جدول

در دنیای امروز که هوش مصنوعی به سرعت در حال پیشرفت است، این سوال مطرح می‌شود که مدل‌های هوش مصنوعی چقدر باهوش هستند و در مقایسه با هوش انسانی چگونه عمل می‌کنند؟ داده‌های جدیدی که توسط Tracking AI جمع‌آوری شده‌اند، با استفاده از آزمون هوش منسا نروژ، رتبه‌بندی جالبی از باهوش‌ترین مدل‌های هوش مصنوعی ارائه می‌دهند. این آزمون که به سختی و دقتش در سنجش هوش انسانی مشهور است، اکنون معیاری برای ارزیابی توانایی‌های شناختی هوش مصنوعی شده است.

پیشتازان هوش مصنوعی

مقیاس هوش: انسان در برابر هوش مصنوعی

برای درک بهتر امتیازات کسب‌شده توسط هوش مصنوعی، یادآوری این نکته ضروری است که میانگین نمره هوش انسانی بین ۹۰ تا ۱۱۰ قرار دارد. کسب نمره‌ای بالاتر از ۱۳۰ در این آزمون، نشانه‌ای از سطح نبوغ و هوش فوق‌العاده محسوب می‌شود.

پیشتازان هوش مصنوعی در آستانه نبوغ

در این رتبه‌بندی، مدل OpenAI o3 با کسب نمره ۱۳۵ در آزمون هوش منسا، در صدر قرار گرفته و به وضوح در دسته «نابغه» جای می‌گیرد. این مدل که بخشی از ChatGPT، یکی از پرکاربردترین ابزارهای هوش مصنوعی در جهان است، توانایی‌های چشمگیری در پردازش و تولید متن از خود نشان داده است.

پس از OpenAI o3، مدل‌های دیگری نیز با امتیازات بالا خودنمایی می‌کنند. Claude-4 Sonnet از Anthropic با نمره ۱۲۷ و Gemini 2.0 Flash Thinking از گوگل با نمره ۱۲۶، فاصله چندانی با صدر جدول ندارند. همچنین، نسخه‌های جدیدتر مانند Gemini 2.5 Pro و OpenAI o4 mini هر دو امتیاز بالای ۱۲۰ را کسب کرده‌اند که نشان‌دهنده عملکردی بالاتر از میانگین هوش انسانی است.

جدول زیر، رتبه‌بندی کامل مدل‌های هوش مصنوعی بر اساس نمرات آزمون هوش منسا نروژ را نشان می‌دهد:

نام مدلنمره آزمون هوش منسا نروژ
OpenAI o3۱۳۵
Claude-4 Sonnet۱۲۷
Gemini 2.0 Flash Thinking Exp.۱۲۶
Gemini 2.5 Pro Exp.۱۲۴
OpenAI o4 mini۱۲۲
Claude-4 Opus۱۲۰
Grok-3 Think۱۱۲
DeepSeek R1۱۰۶
Llama 4 Maverick۱۰۵
OpenAI o1 Pro۱۰۲
DeepSeek V3۱۰۰
GPT4.5 Preview۹۹
Grok-3۹۷
Gemini 2.5 Pro Exp. (Vision)۹۶
GPT-4o۹۳
OpenAI o4 mini high۹۲
Claude-3.7 (Vision)۹۱
Bing Copilot۸۶
Mistral۸۵
OpenAI o1 Pro (Vision)۸۳
OpenAI o3 (Vision)۷۲
Llama-3.2 (Vision)۷۰
GPT-4o (Vision)۶۳
Grok-3 Think (Vision)۶۰

تفاوت‌های چشمگیر: هوش متنی در برابر هوش بینایی

نکته قابل توجه در این بررسی، تسلط مدل‌های متن‌محور در ۱۰ رتبه برتر است. این مدل‌ها که قابلیت پردازش تصاویر را ندارند، نشان داده‌اند که در استدلال و تفکر مبتنی بر کلمات، بسیار قوی عمل می‌کنند. این موضوع نشان می‌دهد که استدلال از طریق زبان، هنوز یک نقطه قوت بزرگ برای هوش مصنوعی محسوب می‌شود.

در مقابل، مدل‌های هوش مصنوعی چندوجهی که قادر به پردازش تصاویر نیز هستند، عملکرد ضعیف‌تری را از خود نشان داده‌اند. پنج مدل آخر در این رتبه‌بندی، همگی مدل‌های بینایی هستند. به عنوان مثال، GPT-4o (Vision) از OpenAI با نمره ۶۳ و Grok-3 Think (Vision) از xAI با نمره ۶۰، به طور قابل توجهی پایین‌تر از میانگین هوش انسانی قرار گرفته‌اند. این امر به این معناست که تفسیر و حل مسائل بصری، همچنان یک چالش بزرگ برای هوش مصنوعی محسوب می‌شود.

نتیجه‌گیری

در مجموع، این نتایج نشان می‌دهند که مدل‌های پیشرو هوش مصنوعی به سطوح بالایی از هوش دست یافته‌اند، به طوری که برخی از آن‌ها حتی از باهوش‌ترین ذهن‌های انسانی نیز پیشی گرفته‌اند. با ادامه این روند، انتظار می‌رود که تفاوت‌های بین هوش مصنوعی و هوش انسانی در آینده بیش از پیش نمایان شود.

مطالب دیگر از همین نویسنده
مشاهده بیشتر
بدون نظر

ورود