گزارش جنجالی: هوش مصنوعی دیپ سیک ۸ ماه از رقبای آمریکایی عقبتر است
مرکز استانداردها و نوآوری هوش مصنوعی (CAISI)، وابسته به مؤسسه ملی استاندارد و فناوری (NIST) ایالات متحده، در گزارشی اعلام کرد که قدرتمندترین مدل هوش مصنوعی چین یعنی دیپ سیک (DeepSeek) V۴ Pro، حدود ۸ ماه از مدلهای پیشرو آمریکایی عقبتر است.
بر اساس این ارزیابی، هرچند دیپ سیک توانمندترین مدل چینی تا به امروز محسوب میشود، اما فاصله فنی آن با رقبای غربی با گذشت زمان در حال افزایش است.
این نهاد دولتی به جای میانگینگیری ساده از نمرات بنچمارک، از روش آماری نظریه پاسخ سؤال (IRT) برای تخمین تواناییهای نهفته مدلها استفاده کرده است. در این رتبهبندی، مدل GPT-5.5 با ۱۲۶۰ امتیاز در صدر قرار دارد، در حالی که دیپ سیک V۴ Pro با کسب ۸۰۰ امتیاز، در جایگاهی نزدیک به نسخه ضعیفتر و قدیمیتر GPT-5.4 mini قرار گرفته است.
گزارش CAISI نشان میدهد که شکاف عملکردی در بنچمارکهای حوزه امنیت سایبری و مهندسی نرمافزار بسیار چشمگیر است؛ به طوری که در تست امنیت سایبری، مدل GPT-5.5 به دقت ۷۱ درصد دست یافت، در حالی که دیپ سیک تنها ۳۲ درصد از سوالات را پاسخ داد. با این حال، در بنچمارکهای عمومی نظیر حل مسائل ریاضی المپیاد، دیپ سیک با دقت ۹۷ درصدی فاصله بسیار کمی با رقبای خود دارد.
با این حال، بسیاری از تحلیلگران و توسعهدهندگان به شفافیت گزارش CAISI انتقاد کردهاند. به گفته آنها، بخش مهمی از این ارزیابی بر پایه بنچمارکهایی انجام شده که عمومی نیستند؛ بنابراین دیگران نمیتوانند نتایج آن را بررسی یا بازتولید کنند.
در همین زمینه، توسعهدهندهای با نام مستعار اگزوبیت (Ex0bit) در شبکه اجتماعی ایکس نوشت:

