رونمایی OpenAI از هوش مصنوعی تبدیل متن به تصویر DALL-E۳
تاریخ انتشار: ۱۲ مهر ۱۴۰۲ | کد خبر: ۳۸۸۱۲۳۷۰
شرکت OpenAI از نسخه سوم ابزار هوش مصنوعی تبدیل متن به تصویر DALL-E خود رونمایی کرد.
هوش مصنوعی DALL-E میتواند پیامهای متنی کاربران را به تصویر تبدیل کند، اما عملکرد دومین نسخه آن با مشکلاتی همراه بود و برخی عبارات خاص را نادیده میگرفت. با این حال اکنون محققان OpenAI اعلام کردهاند که DALL-E ۳ متن کاربران را بسیار بهتر درک میکند.
بیشتر بخوانید:
اخباری که در وبسایت منتشر نمیشوند!
یکی از ویژگیهای جدید DALL-E ۳ ادغام با ChatGPT است. با وجود این ویژگی، دیگر نیازی نیست تا توضیحات دقیقی برای DALL-E ارائه کنید، بلکه میتوانید از ChatGPT بخواهید تا درخواست شما را به آن ارائه کند و با توجه به اینکه DALL-E با جملات طولانیتر عملکرد بهتری از خود ارائه میکند، طبیعتاً این موضوع باعث میشود تا خروجی بهتری داشته باشید. البته همچنان میتوانید از دستورات خود برای ساخت تصویر استفاده کنید.
نسخه جدید DALL-E ابتدا در ماه اکتبر برای مشترکین ChatGPT Plus و ChatGPT Enterprise منتشر خواهد شد و سپس در پاییز برای آزمایشگاههای تحقیقاتی و سرویس API شرکت OpenAI عرضه خواهد شد. هنوز مشخص نیست که این ابزار جدید چه زمانی بهطور رایگان در دسترس عموم کاربران قرار خواهد گرفت.
بهبود امنیت هوش مصنوعی DALL-E ۳
علاوه بر این OpenAI ادعا کرده که در مدل DALL-E ۳ روی ویژگیهای امنیتی زیادی نیز کار کرده است تا از ایجاد تصاویر نامناسب توسط آن جلوگیری شود.DALL-E ۳ همچنین قادر به بازسازی تصاویر چهرههای سرشناس نخواهد بود، مشروط به اینکه در درخواست کاربران به نام خاص اشاره نشده باشد.
«سندینی آگاروال»، محقق سیاست OpenAI درباره ویژگیهای امنیتی این مدل جدید گفت که به آنها «اعتماد زیادی» دارد، اما توضیح داد که این مدل بهطور مداوم بهبود پیدا میکند و هنوز کامل و بینقص نیست. همچنین نمایندگان OpenAI اعلام کردهاند که DALL-E ۳ بهطوری آموزش داده شده که باعث میشود سبک هنرمندان دیگر را تقلید نکند.
منبع: پول نیوز
کلیدواژه: رونمایی رونمایی از پورشه رونمایی از سرپرست جدید تیم ملی والیبال رونمایی از سه سامانه پایش ماهواره ای هوش مصنوعی
درخواست حذف خبر:
«خبربان» یک خبرخوان هوشمند و خودکار است و این خبر را بهطور اتوماتیک از وبسایت www.poolnews.ir دریافت کردهاست، لذا منبع این خبر، وبسایت «پول نیوز» بوده و سایت «خبربان» مسئولیتی در قبال محتوای آن ندارد. چنانچه درخواست حذف این خبر را دارید، کد ۳۸۸۱۲۳۷۰ را به همراه موضوع به شماره ۱۰۰۰۱۵۷۰ پیامک فرمایید. لطفاً در صورتیکه در مورد این خبر، نظر یا سئوالی دارید، با منبع خبر (اینجا) ارتباط برقرار نمایید.
با استناد به ماده ۷۴ قانون تجارت الکترونیک مصوب ۱۳۸۲/۱۰/۱۷ مجلس شورای اسلامی و با عنایت به اینکه سایت «خبربان» مصداق بستر مبادلات الکترونیکی متنی، صوتی و تصویر است، مسئولیت نقض حقوق تصریح شده مولفان در قانون فوق از قبیل تکثیر، اجرا و توزیع و یا هر گونه محتوی خلاف قوانین کشور ایران بر عهده منبع خبر و کاربران است.
خبر بعدی:
تبدیل افکار خاموش ذهن به گفتار| ابزاری که اندیشه را واژه میکند!
خبرگزاری علموفناوی آنا- هدا عربشاهی: استفان هاوکینگ، اخترفیزیکدان و ریاضیدان انگلیسی که بیشاز هرچیز بهدلیل مطالعاتش درباره سیاهچالهها شناخته میشد، از اواخر میانسالی بهطرز روبهرشدی برای برقراری ارتباط با دیگران با مشکل مواجه شد. آتروفی عضلانی نخاعی پیشرونده، بیماری حادی که در سن ۲۱ سالگی به او حملهور شد علاوهبر فلجی ماهیچههای مورد نیاز برای راهرفتن و نوشتن، بهتدریج عضلاتی را که در صحبتکردن نقش دارند درگیر کرد بهطوریکه او سالها فقط با انقباض ماهیچههای گونه و انتقال این حرکات ازطریق حسگرهای فروسرخ به رایانه، توان نوشتن و صحبتکردن داشت. اما زمانیکه او به سن ۷۱ سالگی رسید، قدرت ماهیچههای گونهاش هم به مرور تحلیل رفت و بهاینترتیب، یکی از پویاترین ذهنهای علم قادر بود فقط یک کلمه در دقیقه بنویسد. ازاینرو، سال ۲۰۱۳ شرکت آمریکایی اینتل، پیشگام در فناوریهای تراشه و سامانههای رابط کاربری، دستگاه جدیدی ساخت که به این دانشمند اجازه میداد هر ۶۰ ثانیه ۵ تا ۱۰ کلمه بنویسد و حرف بزند. این سامانه که برپایه فناوری تشخیص چهره بود نهفقط حرکات عضلات گونه، که حرکات دهان و ابروها را هم ثبت میکرد و بهاینترتیب، هاوکینگ میتوانست از آن برای انتخاب حروف روی صفحه نمایشگر رایانه، نوشتن واژهها و عبارات و تبدیل آنها به صدای الکترونیکی استفاده کند. اگر امروز این فیزیکدان انگلیسی زنده بود شاید میتوانست به استفاده از نمونههای اولیه دستگاههایی که به مدد هوشمصنوعی افکار را میخوانند و آنها را به کلمات تبدیل میکنند برای برقراری ارتباط با سرعتی بیشتر امیدوار باشد.
هوشمصنوعی سکوت ذهن را میشکند
از سال ۲۰۱۹ گروهی از دانشمندان دانشگاه کلمبیا در کانادا به سرپرستی پژوهشگر ایرانی، نیما مسگرانی، با کمک هوشمصنوعی گامهای رو به جلویی را برای تحقق رویای امکان تبدیل افکار خاموش ذهن به گفتار برمیدارند. به اعتقاد این دانشوران، آنچه که درحالحاضر قدمهای نخستین خودش را میپیماید ظرف یکدهه آینده به واقعیتی دردسترس تبدیل خواهد شد. تیم نیما مسگرانی مشغول توسعه الگوریتمی است که بااستفاده از هوشمصنوعی و استفاده از دستگاه الکتروانسفالوگرام قادر است سیگنالهای مغز را به کلمات گفتاری تبدیل کند.
همچنین یکسال پیشاز آغاز این پروژه، یعنی سال ۲۰۱۸، گروهی از دانشمندان علوم اعصاب دانشگاه تورنتو، سامانهای را توسعه دادند که امکان بازآفرینی تصویر ذهنی را روی صفحه نمایشگر میسر میکرد. این سامانه زمانی مفید است که شخصی بخواهد چهرهای را تشخیص دهد که در ذهنش واضح است، اما قادر به توصیف آن برای کارشناسان تشخیص چهره یا کشیدن آن روی کاغذ نیست و با کمک این سامانه و به لطف اسکن افکار، بازنمایی آن چهره امکانپذیر میشود. آزمایش این پژوهشگران، نمونهای از افرادی را شامل میشد که عکسی از صورت انسانی به آنها نشان داده شده بود و هنگام انجام الکتروآنسفالوگرام آنها باید درباره تکتک جزییات چهره فردی که تصویرش را دیده بودند فکر میکردند و همزمان، دستگاه ثمره آن افکار را روی صفحه نمایشگر میکشید و بازنمایی میکرد. درنهایت چهره شخص در عکس بهطور کامل روی نمایشگر ظاهر میشد.
اما نیما مسگرانی، سرپرست گروه پژوهشگران دانشگاه کلمبیا در این تحقیقات بر ابزار خاصی بهنام «ووُکدر» بهمعنی «رمزگذار صوت» تکیه کرد. این دستگاه قادر است هر سیگنال صوتی را بهصورت کدهایی رمزگذاری کند. الگوریتمهایی با قابلیت یادگیری جملات و داستانهای کوتاه و بازتولید کلمات و گفتارهای خاص در این دستگاه نصب شدهاند. این همان فناوری است که به سامانه دستیار صوتی الکسا محصول آمازون و سیری محصول اپل اجازه میدهد که به سوالهای کاربران پاسخ صحیح ارائه دهند. این مطالعه دادههایی را از پنج بیمار مبتلا به صرع درحالیکه تحت جراحی مغز و اعصاب بودند جمعآوری کرد. در مغز این بیماران یک سری الکترود کاشته شده بود که به دانشوران اجازه داد همانطورکه بیماران به داستانهایی که چهار نفر مختلف تعریف میکردند گوش میدادند اندازهگیریهای الکتروکورتیکوگرافی جامعی انجام دهند. هر ضبط عصبی حداکثر ۳۰ دقیقه طول کشید.
پساز جمعآوری دادهها، دستگاه رمزگذار صوتی امواج مغزی تولیدشده در قشر شنوایی را خواند و از آنها برای تبدیل آنچه که مغز شنیده بود به گفتار استفاده کرد. سپس صدای تولیدشده با سامانه هوشمصنوعی از هرگونه اصوات مزاحم پاک و درنهایت، دادهها برای شنوندگانی بیرون از این آزمایش پخش شد. بهگفته نیما مسگرانی، شنوندگان تا 75 درصد مواقع توانستند صداها را بفهمند و تکرار کنند که در مقایسه با تلاشهای قبلی بهطور متوسط بینظیر است. او همچنین پیشبینی میکند که این فناوری دستکم تا یک دهه آینده در سطح جهانی در دسترس خواهد بود و هرچند امکان انجام اندازهگیریهای الکتروکورتیکوگرافی (در تماس مستقیم با کورتکس مغز) محدود است، اما بههررو، این آزمایش میتواند پایه و اساس تبدیل افکار انسان به گفتار باشد. گام بعدی، اصلاح الگوریتمها است تا بتوانند کلمات و جملات پیچیده را رمزگشایی کنند، تاحدیکه این فناوری در آینده، واقعا بتواند به نقطه عطفی تبدیل شود که نهفقط در زندگی روزمره، که برای رفاه بیمارانی که بهدلیل بیماریهای تخریب نورونی و آسیبهای مغزی نمیتوانند صحبت کنند هم مفید باشد.
الگوریتمی برای تبدیل فعالیت مغزی به جملات
پساز مطالعات سال ۲۰۱۹ دانشمندان دانشگاه کلمبیا، گروهی از پژوهشگران دانشگاه کالیفرنیا در سال ۲۰۲۰ الگوریتمی را توسعه دادند که قادر است امواج مغزی را پردازش و آنها را به جملات معنادار تبدیل کند. براساس دادههای این محققان که در نشریه تخصصی نیچر نوروساینس منتشر شده است، میانگین میزان خطای این مدل برابر با ۳ درصد است. جوزف ماکین، متخصص یادگیری ماشین در این پژوهش میگوید: «واسطهای ذهن و ماشین موفقیت محدودی در رمزگذاری فعالیتهای عصبی نشان میدهند و قادر به رمزگشایی قطعات کلمات یا جملات خاص ساده هستند.» کار ماکین و گروهش با مشارکت چهار داوطلب شروع شد که در مغز آنها هم الکترودهایی برای نظارت بر تشنجهای صرع کاشته شده بود. از داوطلبان خواسته شد تا حدود ۵۰ جمله مختلف را چندبار با صدای بلند بخوانند: جملات سادهای چون «تینا ترنر یک خواننده پاپ است» یا «آن دزدها ۳۰ جواهر را دزدیدند». و همزمان دانشمندان فعالیت مغز آنها را ثبت کردند. سپس الگوریتم هوشمصنوعی که برای تبدیل سیگنالهای مغز به نمایشهای انتزاعی، در قالب رشتههای عددی طراحی شده بود، این دادههای جمعآوریشده را پردازش کرد. در مرحله بعد، این رشتههای عددی را کلمه به کلمه رمزگشایی کرد تا جملات تولید شوند. درطول مرحله آزمایش، سامانه ابتدا جملات بیمعنی تولید میکرد، اما زمانیکه «یاد گرفت» کدام جملات به کدام رشتهها متصلاند و کدام کلمات بیشتر با هم ظاهر میشوند، نتایج بهبود یافت. هرچند دقت تشخیص از فردی به فرد دیگر متفاوت است اما بهطور متوسط فقط در ۳ درصد جملات خطا شناسایی شد.
انتهای پیام/