..

انویدیا از پلتفرم ویدیوکنفرانس جدیدی به نام Maxine برای توسعه دهندگان رونمایی کرده که به گفته این شرکت می‌تواند برخی از رایج‌ترین مشکلات تماس‌های تصویری را حل کند.

Maxine تماس‌ها را با استفاده از پردازنده‌های گرافیکی انویدیا در فضای ابری پردازش کرده و کیفیت تماس را به کمک هوش مصنوعی ارتقا می‌دهد. این پلتفرم به کمک هوش مصنوعی چهره و نگاه کاربر را به سمت دوربین تصحیح می‌کند، با انتقال «نقاط مهم حالات چهره» پیش نیاز پهنای باند ویدیو را به یک دهم پیش نیاز استاندارد فشرده‌سازی H.264 کاهش داده و رزولوشن ویدیو را افزایش (Upscale) می‌دهد.

از دیگر قابلیت‌های Maxine می‌توان به تصحیح روشنایی چهره، کاهش نویز، تغییر تصویر پس زمینه، ترجمه و زیرنویس همزمان و آواتارهای متحرک اشاره کرد. برخی از قابلیت‌های جالب این پلتفرم را در ادامه مشاهده می‌کنید:





لازم به ذکر است که Maxine یک پلتفرم کاربری نبوده و در واقع یک جعبه ابزار برای شرکت‌های شخص ثالث است تا نرم افزارهای خود را بهبود دهند. «Richard Kerris»، یکی از مدیران ارشد انویدیا این پلتفرم را «بسیار هیجان انگیز» توصیف کرد و از قابلیت فشرده‌سازی ویدیوی آن که مبتنی بر هوش مصنوعی است به عنوان یکی از قابلیت‌های کاربردی یاد کرد.

انویدیا می‌گوید قابلیت فشرده‌سازی پلتفرم Maxine برای بازسازی برخی از قسمت‌های چهره کاربر در فضای ابری از روشی به نام شبکه‌های مولد تخاصمی (GAN) استفاده می‌کند که در بسیاری از ویدیوهای دیپ فیک بکار می‌رود. انویدیا در این رابطه می‌گوید: «به جای استریم تمام پیکسل‌های صفحه، هوش مصنوعی نقاط مهم چهره کاربران حاضر در تماس تصویری را آنالیز کرده و سپس به طور هوشمندانه خروجی ویدیو در آن سوی تماس تصویری را متحرک‌سازی می‌کند. با این کار می‌توان ویدیو را با دیتای بسیار کمتر در اینترنت استریم کرد.»

انویدیا با رونمایی از پلتفرم Maxine نشان داد که آینده ویدیوکنفرانس به سمت مصنوعی‌تر شدن پیش می‌رود و به کمک هوش مصنوعی جهت نگاه و حتی سر کاربر را به سمت لنز دوربین اصلاح کرده و در عین حال در پهنای باند صرفه جویی نمود.