9 آذر 1404

قابلیت ترسناک هوش مصنوعی گوگل

جمنای ۳، هوش مصنوعی جدید گوگل، می‌تواند تنها با یک دستور متنی، دسکتاپ ویندوز، مرورگر کروم و حتی یک نسخه کپی از فتوشاپ را برنامه‌نویسی و اجرا کند.
تا همین چند ماه پیش، همه‌جا صحبت از این بود که گوگل از قافله‌ی هوش مصنوعی عقب مانده است و سوندار پیچای باید استعفا دهد. اما هفته‌ی گذشته،‌ گوگل با معرفی مدل هوش مصنوعی جمنای ۳ چنان گردوخاکی به پا کرد که حالا همه‌ی دنیا دوباره آن‌ها را به چشم غول بی‌رقیب همیشگی می‌بینند؛ شرکتی که همه چیز، از زیرساخت‌های عظیم و تراشه‌های اختصاصی TPU‌ گرفته تا بودجه‌ی بی‌پایان و دسترسی‌به میلیاردها کاربر، را با هم دارد؛ اما نتوانسته بود در رقابت هوش مصنوعی، به محبوبیت OpenAI برسد.

اما تنها چند روز پس از رونمایی جمنای ۳، یادداشتی داخلی از سم آلتمن، مدیرعامل OpenAI، به بیرون درز کرد که اعترافی تلخ در آن نهفته بود: اینکه گوگل بالاخره به گرد پای آن‌ها رسیده است و شرکتش روزهای سختی در پیش دارد.

جمنای ۳، در چند روز اخیر با موجی از میم‌ها و تحلیل‌های مثبت، اینترنت را به تسخیر خودش درآورده است و باعث شد ارزش بازار آلفابت‌ به ۴ تریلیون دلار نزدیک شود.

برای مردم عادی، ChatGPT مساوی است با هوش مصنوعی. اما آیا با جمنای ۳، آنطور که بنچمارک‌ها و تحلیل‌گرها می‌گویند، کار رقبا تمام است؟

جمنای ۳ و آنتی‌گراویتی

گوگل، جمنای ۳ را «بهترین مدل جهان برای درک چندوجهی» و قدرتمندترین مدل این شرکت برای کدنویسی و انجام وظایف معرفی می‌کند که با ترکیب تمام قابلیت‌های قبلی، به کاربر اجازه می‌دهد «هر ایده‌ای را به واقعیت تبدیل کند».

به گفته‌ی گوگل، جمنای ۳ با پنجره‌ی متنی یک میلیون توکنی و خروجی متن تا ۶۴ هزار توکن، بسیار بهتر از قبل می‌تواند نیت و هدف درخواست کاربر را بفهمد، بنابراین با توضیحات کمتر، نتیجه‌ی بهتری می‌گیرد. دمیس هاسابیس، مدیرعامل گوگل دیپ‌مایند هم از جمنای ۳ به‌عنوان «گام بزرگ دیگری به سمت هوش مصنوعی انسان‌گونه (AGI)» یاد کرد.

جمنای ۳ فقط حرف نمی‌زند، «عمل» می‌کند

آنطور که نتایج آزمون‌های گوگل نشان می‌دهد، جمنای ۳ پرو در تمام بنچمارک‌های اصلی هوش مصنوعی، از نسخه‌ی ۲٫۵ پرو پیشی گرفته است؛ عملکردی در سطح دکترا دارد؛ آنچه را که «نیاز دارید بشنوید» می‌گوید و می‌تواند ویدیوها را تحلیل کند یا دست‌خط‌های قدیمی را بخواند.

علاوه‌براین، جمنای ۳ می‌تواند «عمل» کند؛ یعنی می‌تواند در تقویم بگردد، ایمیل بفرستد، کد بنویسد و آن را اجرا کند. برای مثال، می‌توانید به این مدل بگویید «یک بازی فضایی بساز که حس نوستالژیک دهه‌ی ۸۰ را داشته باشد» و هوش مصنوعی خودش جزییات فنی را برای رسیدن به آن حس پیاده‌سازی می‌کند.

آنتی‌گراویتی به صورت محلی روی سیستم اجرا می‌شود

درکنار جمنای ۳، نام پلتفرم جدید «گوگل آنتی‌گراویتی» هم بر سر زبان‌ها افتاده است؛ این پلتفرم مخصوص برنامه‌نویسان است که ظاهری شبیه محیط‌های کدنویسی آشنا دارد، اما برخلاف مدل‌های قبلی که فقط متن تولید می‌کردند، ایجنت‌های Antigravity به ویرایشگر کد، ترمینال و مرورگر دسترسی مستقیم دارند. این ایجنت‌ها همچنین می‌توانند خودشان، کد را تست و اجرا کنند تا مطمئن شوند که درست کار می‌کند.

نکته‌ی جالب‌توجه درباره‌ی آنتی‌گراویتی این است که برخلاف بسیاری از ابزارهای مشابه که تماما در فضای ابری اجرا می‌شوند، این پلتفرم به صورت محلی روی سیستم اجرا می‌شود، اما همچنان قدرتی خیره‌کننده دارد.

دیدگاه‌ها بسته شده‌اند.