مطالب این بخش از سایر خبرگزاری‌ها جمع‌آوری شده است و صرفا جهت افزایش آگاهی شما قرار گرفته است و لزوما به معنای تایید آن توسط چنج‌کن نیست.

گزارش جنجالی: هوش مصنوعی دیپ سیک ۸ ماه از رقبای آمریکایی عقب‌تر است

مرکز استانداردها و نوآوری هوش مصنوعی (CAISI)، وابسته به مؤسسه ملی استاندارد و فناوری (NIST) ایالات متحده، در گزارشی اعلام کرد که قدرتمندترین مدل هوش مصنوعی چین یعنی دیپ سیک (DeepSeek) V۴ Pro، حدود ۸ ماه از مدل‌های پیشرو آمریکایی عقب‌تر است.

بر اساس این ارزیابی، هرچند دیپ سیک توانمندترین مدل چینی تا به امروز محسوب می‌شود، اما فاصله فنی آن با رقبای غربی با گذشت زمان در حال افزایش است.

این نهاد دولتی به جای میانگین‌گیری ساده از نمرات بنچمارک، از روش آماری نظریه پاسخ سؤال (IRT) برای تخمین توانایی‌های نهفته مدل‌ها استفاده کرده است. در این رتبه‌بندی، مدل GPT-5.5 با ۱۲۶۰ امتیاز در صدر قرار دارد، در حالی که دیپ سیک V۴ Pro با کسب ۸۰۰ امتیاز، در جایگاهی نزدیک به نسخه ضعیف‌تر و قدیمی‌تر GPT-5.4 mini قرار گرفته است.

گزارش CAISI نشان می‌دهد که شکاف عملکردی در بنچمارک‌های حوزه امنیت سایبری و مهندسی نرم‌افزار بسیار چشم‌گیر است؛ به طوری که در تست امنیت سایبری، مدل GPT-5.5 به دقت ۷۱ درصد دست یافت، در حالی که دیپ سیک تنها ۳۲ درصد از سوالات را پاسخ داد. با این حال، در بنچمارک‌های عمومی نظیر حل مسائل ریاضی المپیاد، دیپ سیک با دقت ۹۷ درصدی فاصله بسیار کمی با رقبای خود دارد.

با این حال، بسیاری از تحلیل‌گران و توسعه‌دهندگان به شفافیت گزارش CAISI انتقاد کرده‌اند. به گفته آن‌ها، بخش مهمی از این ارزیابی بر پایه بنچمارک‌هایی انجام شده که عمومی نیستند؛ بنابراین دیگران نمی‌توانند نتایج آن را بررسی یا بازتولید کنند.

در همین زمینه، توسعه‌دهنده‌ای با نام مستعار اگزوبیت (Ex0bit) در شبکه اجتماعی ایکس نوشت: