halit21



دیپ فیک ویدیویی بدین معنا است که ما نمی توانیم به هر آنچه که می بینیم، اعتماد کنیم. حال دیپ فیک صوتی نیز بدین معنا است که دیگر گوش های ما قابل اعتماد نیستند. چنین فناوری هایی باعث می شوند تا مشکلات بشر روزبه روز افزایش یابند. در قرن بیستم تنها نگرانی تکنولوژیک انسان ها، به مسائلی همانند بمب های اتمی و شیمیایی مربوط می شد، اما اکنون این دامنه گسترش یافته است.

در چند سال گذشته نگرانی های مختلفی در مورد ماشین ها و بیماری های همه گیر به وجود آمده و حال نیز نوبت به دیپ فیک صوتی رسیده است؛ چیزی که باعث می شود تا مردم اعتماد به صدای یکدیگر را نیز از دست بدهند.

دیپ فیک صوتی چیست؟

به احتمال زیاد، ویدیوهای دیپ فیک را مشاهده کرده اید. در این ویدیوها از الگوریتم های یادگیری عمیق استفاده شده و بدین ترتیب رفتارهای دو نفر با یکدیگر جایگزین می شوند. در صدای دیپ فیک یک صوت شبیه سازی شده غیرقابل تشخیص استفاده شده تا بدین ترتیب بتوان صدای مصنوعی فرد موردنظر را تولید کرد؛ دقیقا همانندفتوشاپکردن صدا.

حداقل فتوشاپ های غیرحرفه ای را می توان تشخیص داد، اما در مورد دیپ فیک صوتی فقط می توان حدس زد، آن هم با میزان درستی 57 درصد! علاوه بر این، از آنجایی که بسیاری از ضبط های صدا توسط میکروفن گوشی ها انجام می پذیرد (یا در محیط های پر سروصدا)، پس دیپ فیک صوتی می توانند بهتر کار خود را انجام دهد. حال سؤال اینجا است که چرا یک شخص باید به فتوشاپ کردن صدا بپردازد؟

توجیه تولید صدای مصنوعی

یکی از این موارد به صنعتبازی های ویدیوییمربوط می شود. در گذشته امکان نداشت که صدا را به محض درخواست، ایجاد کرد. حتی در عناوین تعاملی که از گرافیک سینمایی نیز برخوردار هستند، ارتباطات کلامی با شخصیت های غیرقابل بازی، چندان پویا به نظر نمی رسند.

حال با پیشرفت فناوری، استودیوهای بازی سازی نیز می توانند صدای شخصیت ها را شبیه سازی کرده و با استفاده از یک موتور تبدیل کننده متن به صوت، سخنان شخصیت های درون بازی ها را پویاتر نشان دهند. در واقع این فرایند در زمان واقعی رخ داده و از پیش تعیین و رندر نمی شود.

البته این فناوری استفاده هایی نیز در تبلیغات، فناوری و خدمات پشتیبانی از مشتریان دارد. در اینجا نیز صدای یک انسان قابل اعتماد شبیه سازی شده و متون گفتار نیز توسط هوش مصنوعی تعیین و ادا می شوند. شرکت های شبیه سازی صدا، در مورد کاربردهای پزشکی این فناوری نیز هیجان زده هستند. البته این موضوع چندان جدید نبوده و در واقع استیون هاوکینگ نیز از صدای مصنوعی استفاده می کرد. اما حال چنین مواردی می توانند بهبود بیشتری را تجربه کنند.

در سال 2008، شرکت شبیه سازی صدای CereProc، صدای راجر ایبرت (Roger Ebert) را پس از سرطان گرفتن وی، شبیه سازی کرد. همچنین این شرکت وب سایتی را نیز ایجاد کرده بود که در آن مردم می توانستند متنی را تایپ کرده و سپس این متن با صدای جورج بوش، بیان شود.

دیپ فیک صوتی

صدای شبیه سازی شده چگونه کار می کند؟

شبیه سازی صدا در حال حاضر از محبوبیت مناسبی برخوردار است. شرکت هایی همانند Resemble AIو Descript وب سایت هایی را دایر کرده اند که می توانید در آن ها به صورت رایگان، صدای خود را شبیه سازی کنید. در این زمینههوش مصنوعیو مخصوصا الگوریتم های یادگیری عمیق هستند که می توانند صدای ضبط شده را با متن مربوطه تطبیق داده و در نتیجه صدای شما را شبیه سازی کنند. در ادامه هوش مصنوعی از بلوک های ساختاری زبان استفاده کرده تا بدین ترتیب بتواند تقریبی از کلماتی را که تا به حال از زبان شما نشنیده، به دست آورد.

متیو آیلت (Matthew Aylett)؛ مدیر ارشد علمی شرکت CereProc می گوید: ldquo;پایه این فناوری مدت ها است که وجود دارد، اما تنها به مقداری کمک نیاز دارد. کپی کردن صدا همانند درست کردت شیرینی است. این کار کمی سخت بوده و همچنین راه های مختلفی نیز جهت انجام آن وجود دارند.rdquo;

توسعه دهندگان جهت کسب نتایج مورد قبول، به مقادیر زیادی از صداهای ضبط شده نیاز دارند. چند سال پیش، دانشمندان شبکه های GAN را توسعه دادند. بدین ترتیب برای اولین بار، امکان قیاس از داده های موجود فراهم شد. آیلت می گوید: ldquo;به جای اینکه یک رایانه، تصویری را از یک اسب مشاهده کند و بگوید که این اسب است، مدل من اکنون می تواند یک اسب را به یک گورخر تبدیل کند. بنابراین پیشرفت های شبیه سازی صدا، مدیون تلاش های آکادمیک حوزه رایانه هستند.rdquo;

یکی از مهم ترین پیشرفت ها در زمینه شبیه سازی صدا، مربوط به کاهش حجم صدای اولیه موردنیاز است. در گذشته حجم بالایی از صدای شخص موردنیاز بود، اما اکنون تنها چند دقیقه کافی است.

ترس ناشی از بی اعتمادی به همه چیز

فناوری هایی همانند انرژی هسته ای، فناوری نانو،چاپ سه بعدیو CRISPR، در عین هیجان انگیز بودن، ترسناک نیز هستند. در اخبار نیز مواردی به چشم می خورند که طی آن ها، دیپ فیک صوتی توانسته که مردم را فریب دهد.

در کانال های یوتیوبی، می توان ویدیوهایی از رؤسای جمهور پیشین آمریکا را مشاهده کرد که در آن ها، این اشخاص مشغول خواندن یک آهنگ هستند. موسیقی و صداهای پس زمینه باعث می شوند تا حرکات رباتیک کمتر به چشم آیند، اما در هر صورت پتانسیل زیادی در این موضوع وجود دارد.

می توان به آسانی تصور کرد که این فناوری به مرور زمان بهتر خواهد شد. سیستم های صدای دیپ فیک به ورودی های کمتری احتیاج خواهند داشت و همچنین پردازش های سریع تر نیز می توانند شبیه سازی را در آن واحد انجام دهند. به مرور هوش مصنوعی بهتر نیز می تواند لحن و ریتم صدای اشخاص را بهتر شبیه سازی کند.

مسائل اخلاقی مرتبط با دیپ فیک صوتی

اکثر شرکت های فعال در این زمینه سعی دارند تا این فناوری را به جهت ایمن و درستی راهنمایی کنند. مثلا شرکت Resemble AI، یک بیانیه اخلاقی را در وب سایت خود قرار داده که در زیر به گزیده ای از آن اشاره می کنیم:

ldquo;ما نسبت به شرکت های مختلف، سختگیری هایی را اعمال کرده و مطمئن می شویم که صدای شبیه سازی شده توسط آن ها استفاده شده و همچنین رضایت کامل صدا پیشه ها را نیز جلب کرده اند.rdquo;

کاندان کومار (Kundan Kumar)؛ بنیان گذار Lyrebird (که اکنون بخشی از Descript است)، می گوید که Lyrebird از ابتدا نسبت به سوءاستفاده حساس بوده و به همین دلیل است که اکنون Descript به مردم اجازه می دهد که فقط صدای خود را شبیه سازی کنند.

خوب است که می شنویم بازیگران مطرح این صنعت، به موازین اخلاقی پایبند هستند. اما در هر صورت ابزارهای دیپ فیک صوتی دیگری نیز وجود دارند که چنین رویه ای را در پیش نگرفته و حتی جهت سوءاستفاده از آن ها، به دانش کدنویسی نیز نیازی ندارید.

متخصصان امنیت، پیش تر نیز با چنین مواردی مواجه شده اند

پیش از اینکه دیپ فیک صوتی قابل استفاده باشد، ان همیشه سعی کرده اند که به صورت تلفنی، نسبت به سرقت پول اقدام کنند، اما متخصصان امنیت در این گونه مواقع نیز حاضر بوده اند. شرکت هایی همانند Pindrop به این کار مشغول بوده و طبق ادعاهای این شرکت، آن ها 1.2 میلیارد مکالمه صوتی را تحلیل کرده و توانسته اند که از سرقت 470 میلیون دلار پول، جلوگیری کنند.

پیش از دیپ فیک صوتی، ان از مکانی دیگر تماس می گرفتند و با ارائه اطلاعات شخصی هدف خود، سعی می کردند که وجوه وی را انتقال دهند. ویجی بالاسوبرامانیان (Vijay Balasubramaniyan)؛ مدیرعامل Pindrop، می گوید: امضای صوتی به ما اجازه می دهد که ویژگی های صوتی را تشخیص داده و بدین ترتیب بفهمیم که تماس موردنظر از نیجریه و با استفاده از اسکایپ صورت گرفته است. در حالی که می دانیم مشتری واقعی از گوشی ATamp;T استفاده کرده و از آتلانتا نیز تماس می گیرد. گاهی اوقات با هایی مواجه می شویم که صدای جوجه و یا گریه کودک را در پس زمینه تماس های خود استفاده می کنند تا بدین ترتیب بتوانند کارمندان ما را فریب دهند. حتی مواردی نیز داشته ایم که در آن ها مردها سعی کرده اند تا با استفاده از ابزارهای شبیه سازی، فرکانس صدای خود را افزایش داده و بدین ترتیب صدای خود را نه جلوه دهند. اما گاهی اوقات نرم افزار مورد استفاده آن ها خوب کار نکرده و صدایی شبیه به شخصیت های کارتونی تولید می کند.rdquo;

آیا کسی می تواند دیپ فیک صوتی را تشخیص دهد؟

اگر پس از گوش دادن به صدای یک شخص، به سختی بتوانیم مصنوعی بودن آن را متوجه شویم، آنگاه این موضوع می تواند حاوی خبرهای خوب و بدی برای ما باشد. خبر خوب این است که هوش مصنوعی و سیستم های یادگیری عمیق در حال تکامل بوده و جهت تولید صدایی واقعی، به ورودی های کمتری احتیاج دارند. خبر بد هم این است که تشخیص موارد تقلبی و همچنین ی ها نیز مشکل تر می شود.

هر چقدر طول یک فایل کمتر باشد و در محیط های شلوغ تری نیز ضبط شده باشد، آنگاه تشخیص دیپ فیک بودن آن نیز سخت تر خواهد شد. نکته ای که در این بین وجود دارد، این است که اگر انسان ها قادر به تشخیص صدای تقلبی نباشند، در هر صورت کامپیوترها قادر به انجام این کار خواهند بود. خوشبختانه ابزارهای تصدیق هم اکنون نیز وجود دارند. شرکت Pindrop ابزاری را استفاده می کند که حتی اگر تمامی صداهای فایل مورد بررسی نیز توسط شخص واقعی ضبط شده باشند، بازهم بتواند مصنوعی بودن صدای شبیه سازی شده را تشخیص دهد.

بسته به کیفیت صدا، هر ثانیه از مکالمه می تواند بین 8000 الی 50000 نمونه داده جهت تحلیل را در بر داشته باشد. بالاسوبرامانیان می گوید: ldquo;چیزی که ما به دنبال آن هستیم، محدودیت های گفتاری ناشی از تکامل انسان ها هستند. به عنوان مثال، دو صدای آواز، حداقل تفاوت هایی را با یکدیگر دارند، زیرا به دلیل محدودیت های فیزیکی، نمی توان برخی از عبارات را از حدی سریع تر بیان کرد. مثلا با شنیدن برخی از صداهای ترکیبی، می گوییم که امکان ندارد این صدا متعلق به یک انسان باشد، زیرا برای ادای آن، فرد باید یک گردن 7 فوتی داشته باشد.rdquo;

برخی صداها نیز وجود دارند که سایشی نامیده می شود (حروفی همانند F ،S ،V و Z). سیستم های یادگیری عمیق به سختی می توانند این صداها را از نویزها تمایز دهند. الگوریتم های هوش مصنوعی به سختی می توانند پایان کلمات را از نویز پس زمینه تمایز دهند، بنابراین محو شدن کلمات در چنین مدل هایی، بیش از گفتار واقعی انسان ها رخ می دهد. به همین دلیل رایانه ها آسان تر می توانند مصنوعی بودن صدا را تشخیص دهند.

مقابله با دیپ lrm;فیک، هوشیاری می طلبد

پیش بینی دقیق آینده دیپ فیک صوتی، دشوار است. اما می توان گفت که ما در آستانه ی های صوتی قرار داریم، هر چند که خطر وقوع چنین مواردی در حال حاضر پایین بوده و ابزارهای تشخیصی نیز می توانند کار خود را به خوبی انجام دهند.

هنری آجِر (Henry Ajder)؛ مدیر بخش تهدید اطلاعاتی در Deeptrace، می گوید: ldquo;اگر مردم ابزارهای دیپ فیک صوتی متن-باز را به یکدیگر متصل کرده و سپس آن ها را در قالب اپلیکیشن و یا سرویس های کاربرپسند (و بدون تعهدات اخلاقی) عرضه کنند، آنگاه مشکلات متعددی در این زمینه به وجود خواهند آمد.rdquo;

بدین ترتیب، حیاتی است که شرکت های امنیتی خود را در برابر چنین تهدیدهایی مقاوم کرده و به عنوان مثال بتوانند آسیب پذیری روز-صفر بعدی را بهتر درک کنند که طبیعتا دیپ فیک صوتی کاندیدای اصلی این موضوع خواهد بود.

منبع:

https://itresan.com/307212/%D8%AF%DB%8C%D9%BE%e2%80%8c%D9%81%DB%8C%DA%A9-%D8%B5%D9%88%D8%AA%DB%8C-%DA%86%DB%8C%D8%B3%D8%AA-%D9%88-%D8%A2%DB%8C%D8%A7-%D8%AA%D9%87%D8%AF%DB%8C%D8%AF%DB%8C-%D8%A8%D8%B1%D8%A7%DB%8C-%D8%AC%D9%88


طبق گزارشی جدید ساعت هوشمند جدید سامسونگ مجهز به قابلیتی است که به کاربر اجازه می دهد با باز و بسته کردن مشت خود به تماس صوتی پاسخ دهد.

به گزارش مهر به نقل از انگجت، پاسخ دادن به تماس صوتی با استفاده از ساعت هوشمند کار چندان آسانی نیست، به خصوص اگر کاربر مشغول انجام فعالیتی با دستانش باشد.

اما به نظر می رسد پاسخ به تماس صوتی با باز و بسته کردن مشت دست ساعت هوشمند جدید سامسونگ به نام <<گلکسی واچ۳ >> این کار را راحت تر کرده است. طبق گزارشی جدید، کارشناسان در اپلیکیشن مربوط به ساعت گلکسی واچ ۳ ارجاعاتی به پشتیبانی این گجت از حرکات دست برای انجام فعالیت های مختلف از جمله پاسخ دادن به تماس مشاهده کرده اند.

به عنوان مثال اگر زنگ ساعت هوشمند به صدا دربیاید، کاربر می تواند با باز و بسته کردن مشت خود به تماس پاسخ دهد یا برای رد تماس دستش را تکان دهد.

همچنین ساعت هوشمند سامسونگ احتمالا مجهز به قابلیتی خواهد بود که افتادن و زمین خوردن فرد را ردیابی می کند. به طور دقیق تر، اگر گلکسی واچ۳ سکندری خوردن کاربر را ردیابی کند، به مدت ۶۰ ثانیه زنگ هشداری منتشر می کند تا واکنش کاربر را دریافت کند.

اگر کاربر واکنشی نشان ندهد، گجت به طور خودکار موقعیت کاربر را همراه یک پیام صوتی برای شماره تماس های اضطراری وی ارسال می کند.

پیش بینی می شود سامسونگ ساعت هوشمند جدید خود را در رویداد آنلاینی رونمایی کند که ۵ آگوست برگزار می شود. البته بارگیری گجت چند روز یا چند هفته بعد آغاز می شود.


اگر می خواهید برای کنفرانس ها و پروژه های خود مدل و نمودار تهیه کنید، می توانید از نرم افزار Google Slides استفاده نمایید.

نرم افزار Google Slides برای کاربران این امکان را فراهم آورده است تا در مرورگر خود مدارک و اسناد خود را ویرایش کنند. افراد حتی می توانند هم زمان در متن خود تغییراتی ایجاد کنند و بدون نیاز بهنرم افزار دیگری آن را ذخیره نمایند.

نحوه افزودن موسیقی و ویدیو به Google Slides :

اگر می خواهید موسیقی را به Google Slides اضافه کنید ، باید ازیک فیلم YouTube یا Google Drive استفاده کنید ، یا به جای آن به یک سرویس پخش شخص ثالث لینک دهید.

یک ویدیوی YouTube اضافه کنید :

شما نمی توانید فایلهای صوتی را به ارائه های Google Slide اضافه کنید ، اما می توانید ویدیوها را اضافه کنید. آسانترین راه حل برای کاربرانی که می خواهند موسیقی خود را بهنمایش Google Slide اضافه کنند ، اضافه کردن یک فیلم YouTube است.

این یک ویدیوی YouTube را مستقیماً به نمایش Google Slide شما اضافه می کند ، پخش کننده ویدیوی YouTube را با گزینه های پخش بار می کند. هنگامی که یکویدیو شروع به پخش کرد ، تا زمانی که به اسلاید بعدی بروید ، پخش آن ادامه خواهد یافت.

برای شروع ، نمایشگوگل اسلاید خود را باز کرده و روی اسلایدی که می خواهید ویدیوی YouTube خود را اضافه کنید ، کلیک کنید. در منوی بالا ، Insert > Video کلیک کنید.

, گوگل اسلاید, نرم افزار Google Slides

آموزش تصویری Google Slide

می توانید فیلمهای YouTube را در برگهldquo;Searchrdquo; در کادر انتخاب ldquo;Insert Videordquo; جستجو کنید. اگر نشانی اینترنتی YouTube خاصی ندارید ، از این ابزار جستجو برای یافتن یک فیلممرتبط استفاده کنید.

پس از یافتن یک فیلم ، آن را انتخاب کرده و سپس روی دکمه "Select" در پایین کلیک کنید تا آن را به نمایش خود اضافه کنید.

, گوگل اسلاید, نرم افزار Google Slides

گوگل اسلاید

اگر از قبل ویدیوی YouTube را دارید که می خواهید URL اضافه کنید و URL آن را آماده کنید ، روی زبانه ldquo;By URLrdquo; کلیک کرده و آدرس وب را در کادر ارائه شده قراردهید.

پیش نمایش ویدیوی شما در زیر آن ظاهر می شود. پس از آماده شدن ، روی دکمه "Select" کلیک کنید.

, گوگل اسلاید, نرم افزار Google Slides

نحوه افزودن موسیقی به Google Slides

ویدیوی شما در اسلایدهای انتخابی شما درج می شود که می توانید اندازه و موقعیت آنرا تغییر دهید.

, گوگل اسلاید, نرم افزار Google Slides

آموزشکار با گوگل اسلاید

یک ویدیوی Google Drive اضافه کنید :

به عنوان جایگزین برای درج فیلم های YouTube ، کاربران Google Slides می توانند ویدیوهای شخصی Google Drive خود را درج کنند. می توانید این فیلم هارا از همان کادر انتخاب ldquo;Insert Videordquo; در بالا وارد کنید.

مانند فیلم های YouTube ، فیلم های درج شده در Google Drive تا زمانی که به اسلایدهای دیگر منتقل شوید ، پخش می شوند.

برای افزودن ویدیوی Google Drive ، به اسلایدهای انتخابی خود بروید ،Insert > Video کلیک کنید ، روی زبانه "Google Drive" کلیک کنید ، و سپس ویدیوی خود را ازفضای ذخیره سازی ابری خود پیدا کنید.

ابتدا باید با استفاده از برنامه رایانه شخصی یا آپلود کردن ویدیو از وب سایت Google Drive ، ابتدا فایلهای ویدئویی خود را با Google Drive همگام کنید.

پس از یافتن ویدیویی در فضای ذخیره سازی Google Drive ، بر روی آن کلیک کرده و سپس بر روی دکمه "Select" کلیک کنید.

, گوگل اسلاید, نرم افزار Google Slides

افزودن ویدیو به Google Slides

ویدیوی شما روی اسلایدها درج می شود. سپس می توانید متناسب با ارائه خود آن را تغییر موقعیت و سایز دهید.

شما می توانید از این روش برای اضافه کردن فیلم ها فقط از همان حساب Google استفاده کنید تا نسخه نمایش Google Slides خود را ایجاد کنید. اگر می خواهید انواع دیگرفیلم ها را وارد کنید ، باید به جای آن از یک ویدیوی عمومی YouTube استفاده کنید.

منبع :https://www.beytoote.com/computer/tarfand-i/add-music02-googleslides.html


 اخبار تکنولوژی ,خبرهای تکنولوژی,نسخه وب واتس اپ
طبق گزارشی جدید واتس اپ به زودی قابلیت تماس صوتی و ویدئوچت را برای نسخه دسک تاپ عرضه می کند.

به گزارش مهر به نقل از اندروید پلیس، واتس اپ به زودی از قابلیت تماس در نسخه دسک تاپ پشتیبانی می کند. طبق گزارشی که وب سایتWABetaInfo منتشر کرده این به روز رسانی به کاربران اجازه می دهد با تماس صوتی و ویدئو چت انجام دهند.

اسکرین شات هایی از نسخه آتی واتس اپ وب نشان می دهد یک گزینه پاپ آپ با گزینه رد یا قبول تماس افزوده می شود. هنوز مشخص نیست تماس های ویدئویی، مشابه نسخه موبایل است یا خیر.

 اخبار تکنولوژی ,خبرهای تکنولوژی,نسخه وب واتس اپ

احتمالا به روز رسانی ها از تماس های ویدئویی و صوتی گروهی نیز پشتیبانی می کنند اما احتمالا محدودیت برقراری تماس تا ۸ نفر در آنها وجود خواهد داشت.

هنوز مشخص نیست واتس اپ چه زمان این قابلیت ها را ارائه می کند اما طبق گزارش منبع ذکر شده، آنها به زودی عرضه می شوند.

https://www.beytoote.com/computer/technews/tnews11063548.html


آخرین جستجو ها