یکی از آپدیتهای بزرگی که در دنیای هوش مصنوعی اتفاق افتاده است، این است که شرکت چینی Kuaishou در نسخه جدید هوش مصنوعی خود قابلیت تولید صوت و کنترل صدا را قرار داده است. نسخه جدید مدل هوش مصنوعی Kling 2.6 باعث میشود که شما بتوانید محتوای گفتاری را با دقت بیشتری تولید کنید. در این نسخه حتی میتوانید از صدای خودتان استفاده کنید و ویدیوهایی با حرکات طبیعی و شخصیتهایی ثابت بسازید.
این ویژگی جدید که از آن با عنوان “Voice Control” رونمایی شده، به کاربران امکان میدهد با صدای خودشان یک فایل صوتی را آپلود کنند و به او آموزش دهند تا در نهایت خروجی موردنظر خود را دریافت کنند. نسخه جدید Kling 2.6 بر خلافهای مدلهای قبلی، صداهای مختلفی از انسانها مانند گفتار عادی، گفتار صمیمانه، آواز خواندن (حتی خواندن موزیکهای رپ) و حتی دیالوگهای دوطرفه دارد. در حالیکه مدلهای قبلی تنها صداهای تصادفی تولید میکردند. همچنین این نسخه میتواند نویزهای محیطی را مدیریت کند. مثلا اگر دیالوگ بین دو نفر در خیابان است، میتوانید در پسزمینه صدای خیابان (حرکت ماشینها و…) را قرار دهید.
قابلیت بعدی که در این نسخه قرار دارد، بهبود قابل توجه سیستمهای کنترل حرکت در ویدیو است. بر اساس ادعایی که شرکت Kuaishou کرده است، سیستم جدید بهبود شگفتانگیزی در حرکات کامل بدن با جزئیات ریز دارد. حرکات هم سریعتر و هم با دقت بالا خواهد بود. فرض کنید میتوانند حرکات رزمی یا رقصهایی که چالش زیادی دارند را با دقت بیشتری انجام دهند، مثلا حرکت لبها و دستها هماهنگتر و طبیعیتر است که باعث میشود ساخت ویدیو با هوش مصنوعی سادهتر شود. در این مدل ویدیو رفرنسهای حرکتی بین 3 تا 30 ثانیه خواهد بود.
برای استفاده از این مدل هوش مصنوعی میتوانید از جی پی تی فای استفاده کنید و با خرید یک اکانت اختصاصی، به تمام مدلهای هوش مصنوعی در یک پلتفرم دسترسی داشته باشید.