انویدیا، یکی از تولیدکنندگان پیشرو تراشه در جهان، هوش مصنوعی Fugatto را معرفی کرد. مدلی مولد که می تواند صدا و لهجه کاربران را تغییر دهد.
چند روز پیش مشخص شد که انویدیا که در حال حاضر عنوان بزرگترین تامین کننده تراشه های سرور هوش مصنوعی جهان را در اختیار دارد، تصمیم گرفته است. دانشکده هوش مصنوعی ساکن اندونزی اکنون گزارشی منتشر شده است که از معرفی هوش مصنوعی فوگاتو خبر می دهد.
هوش مصنوعی Fugatto می تواند صداهای ناشناخته تولید کند
همانطور که مشخص است، این مدل تولیدی می تواند محتوای متنی شما را به محتوای صوتی تبدیل کند. اما نکته جالب این است که یک تبدیل ساده نیست. می توانید متنی را به این نسخه از هوش مصنوعی ارائه دهید و در انتها موزیک یا صدای ناشناس را دریافت کنید.
بر اساس گزارش های منتشر شده، تفاوت هوش مصنوعی فوگاتو با سایر مدل های موجود در این است که می تواند صداهای موجود را نیز تغییر یا اصلاح کند. به عنوان مثال، هوش مصنوعی آنودیا می تواند یک قطعه موسیقی را به صدا تبدیل کند یا صدای افراد را به طور کامل به لحن و گویش جدیدی تغییر دهد. ویژگی صداهای ناشناخته آن عجیب تر از سایرین است زیرا می تواند صدای شیپور را مانند پارس سگ ایجاد کند.
برایان کاتانزارو، معاون تحقیق و توسعه یادگیری عمیق کاربردی در انویدیا، در توضیح این فناوری میگوید:
فکر میکنم هوش مصنوعی مولد قابلیتهای جدیدی را برای موسیقی، بازیهای ویدیویی و افرادی که میخواهند چیزهایی خلق کنند، به ارمغان بیاورد. هر فناوری مولد همیشه با خطراتی همراه است. زیرا ممکن است افراد از آن برای ایجاد محتوای نامناسب استفاده کنند. ما باید در این مورد محتاط باشیم، بنابراین هیچ برنامه فوری برای عرضه فوگاتو نداریم.
مشکلی که اکنون شرکت های بزرگ فناوری هنگام عرضه این مدل ها با آن مواجه هستند این است که هنوز راه حلی برای جلوگیری از سوء استفاده از این فناوری مانند دیپ فیک یا نقض کپی رایت پیدا نکرده اند.
داده های آموزش منبع باز مسئول آموزش هوش مصنوعی Fugatto بوده است. اما این شرکت مانند متا و OpenAI هنوز تصمیمی برای انتشار آن نداشته است.
بیشتر بخوانید:
ارسال نقد و بررسی