@ai_new_ir

مدیر عامل ElevenLabs: مدل‌های صوتی AI به مرور زمان به کالایی تبدیل می‌شوند


مدیر عامل ElevenLabs، ماتی استانیسزوسکی، در کنفرانس TechCrunch Disrupt 2025 اعلام کرد که مدل‌های صوتی AI به مرور زمان به کالایی تبدیل می‌شوند. او درباره دیدگاه‌های کوتاه‌مدت و بلندمدتش در خصوص فضای صوتی AI صحبت کرد.

استانیسزوسکی توضیح داد که محققین شرکت توانسته‌اند برخی از چالش‌های مرتبط با معماری مدل‌ها را حل کنند و تمرکزشان بر فضای صوتی برای یکی دو سال آینده ادامه خواهد داشت.

او گفت: «در بلندمدت، این مدل‌ها به کالای عمومی تبدیل می‌شوند. حتی اگر تفاوت‌هایی وجود داشته باشد که به نظر من برای برخی صداها و زبان‌ها حقیقت خواهد داشت، این تفاوت‌ها به خودی خود کوچک‌تر خواهند شد.»

به سوالی درباره اینکه چرا ElevenLabs بر ساخت مدل‌ها تمرکز دارد، پاسخ داد که در حال حاضر این مدل‌ها بزرگترین مزیت و تغییر محسوس هستند که می‌توانید به آن دست پیدا کنید. اگر صداها یا تعاملات AI خوب به نظر نرسند، این هنوز مشکلی است که باید حل شود. «تنها راه‌حل این مشکل، ساخت مدل‌ها توسط خودتان است، و سپس در بلندمدت بازیکنان دیگری هم آن را حل خواهند کرد.»

او همچنین اشاره کرد که کسانی که به دنبال موارد استفاده مقیاس‌پذیر و قابل اعتماد هستند، احتمالاً از مدل‌های مختلف برای موارد استفاده مختلف استفاده خواهند کرد.

استانیسزوسکی گفت که در سال یا دو سال آینده، تعداد بیشتری از مدل‌ها به رویکردهای چندگانه یا تلفیقی خواهند رفت. او اشاره کرد: «پس شما همزمان صدا و ویدیو یا صدا و LLMها را در محیطی گفتگویی ایجاد خواهید کرد.»

بنیان‌گذار گفت که ElevenLabs در نظر دارد با دیگر شرکت‌ها و فن‌آوری‌های متن‌باز همکاری کند تا ببیند آیا می‌توانند تخصص صوتی خود را با برخی از مدل‌های دیگر ترکیب کنند.

برای ElevenLabs، هدف تمرکز بر ساخت مدل‌ها و کاربردها برای ایجاد ارزش بلندمدت است. او گفت: «همانطور که نرم‌افزار و سخت‌افزار جادوی اپل بود، ما فکر می‌کنیم محصول و هوش مصنوعی، جادوی نسل جدید موارد استفاده خواهد بود.»