OpenAI با مدل‌های قدرتمندتر پیشتاز در جذب توسعه‌دهندگان

OpenAI در روز توسعه‌دهندگان خود اعلام کرد که از به‌روزرسانی‌های جدید API رونمایی کرده که شامل مدل زبان GPT-5 Pro، مدل جدید تولید ویدئو Sora 2، و یک مدل صدای کوچکتر و ارزان‌تر می‌شود.

این به‌روزرسانی‌ها بخشی از یک سری از اعلامیه‌ها بودند که به دنبال جذب توسعه‌دهندگان به اکوسیستم OpenAI هستند، از جمله راه‌اندازی یک ابزار ساخت عامل و قابلیت ساخت اپلیکیشن‌ها در ChatGPT.

اضافه شدن GPT-5 Pro می‌تواند بر توسعه‌دهندگانی که برنامه‌هایی در حوزه‌های مالی، حقوقی و بهداشتی می‌سازند تأثیرگذار باشد - صنایعی که به "دقت بالا و عمق استدلال" نیاز دارند، به گفته سم آلتمن، مدیر عامل OpenAI.

آلتمن همچنین اشاره کرد که قابلیت‌های صوتی در آینده یکی از روش‌های اصلی تعامل با هوش مصنوعی خواهد بود. به همین منظور، OpenAI در حال راه‌اندازی "gpt-realtime mini"، یک مدل صدای کوچکتر و ارزان‌تر در API است که از تعاملات جریان پایین تأخیر برای صوت و گفتار پشتیبانی می‌کند. مدل جدید ۷۰ درصد ارزان‌تر از مدل صدای پیشرفته قبلی OpenAI است اما قول می‌دهد که "همان کیفیت و بیان صوتی را دارد."

در نهایت، سازندگانی که در اکوسیستم توسعه‌دهندگان OpenAI فعالیت می‌کنند اکنون می‌توانند از Sora 2 در پیش‌نمایش API استفاده کنند. OpenAI هفته گذشته Sora 2، آخرین مولد صوت و ویدئو خود را همراه با اپلیکیشن Sora که رقابت‌کننده‌ای برای TikTok است، منتشر کرد.

آلتمن در Dev Day اشاره کرد که یکی از هیجان‌انگیزترین چیزهایی که ما روی آن کار کرده‌ایم این است که چگونه این مدل جدید به خوبی صدا و تصویر را با هم جفت می‌کند، نه فقط گفتار، بلکه دارد زمینه‌های صوتی غنی، صدای محیط و افکت‌های هم‌زمان که با آنچه مشاهده می‌کنید، هماهنگ است.

Sora 2 به عنوان ابزاری برای توسعه مفهوم معرفی شده است، خواه این شروع تصویری برای یک آگهی مبتنی بر حس کلی یک محصول باشد، و یا طراحی کننده ماتل که یک اسکچ را به مفهوم یک اسباب‌بازی تبدیل کند - مثالی که آلتمن در Dev Day ارائه داد و به قرارداد OpenAI با سازنده Barbie برای وارد کردن هوش مصنوعی در پروسه ساخت اسباب‌بازی اشاره دارد.