چگونه ادراک تصویری هوش مصنوعی باعث دگرگونی تدریجی یک تصویر می گردد؟
به گزارش استدیو مرینا، گاهی یک عکس ساده می تواند فرصتی باشد برای تماشا آنچه معمولاً از نگاه ما پنهان می ماند؛ اینکه ادراک تصویری هوش مصنوعی و تغییر تدریجی تصویر چگونه عمل می نماید و چرا مدل های زبانی و بینایی، دنیا را نه مثل دوربین، بلکه مثل یک تفسیرگر فعال بازسازی می نمایند.
در آزمایشی مجذوب نماینده که کاربران در شبکه های اجتماعی به اشتراک گذاشتند، یک تصویر انسانی به مدل داده شد و از هوش مصنوعی خواسته شد آن را کپی کند، سپس دوباره کپی به هوش مصنوعی داده شد و دستور کپی مجدد داده شد و این کار بارها تکرار شد. اما چیزی که در نهایت شکل گرفت کپی نبود، بلکه برداشت تازه ای بود، برداشت هایی کوچک که در هر چرخه به آن اضافه شد و مسیر تصویر را به سوی چهره ای خالی برد.
پرسشی که در پسِ این تجربه ظاهر می شود این است که چرا بازفراوری مکرر یک تصویر، به جای وفاداری به همان تصویر اصلی، دچار تغییری آرام و خزنده می شود و به تدریج جمع جبری این تغییرات چیزی کاملا نو ایجاد می نماید. ا
ین رفتار برای انسان نیز آشناست؛ ما نیز وقتی خاطره ای را بارها برای خود یا دیگران تکرار می کنیم، جزئیاتی کوچک از ذهنمان به آن می افزاییم و جند دور نقل قول یک خاطره منجر به دگرگونی آن می شود. در فاصله نسل ها و قرن ها که تغییرات بسیار رادیکال می شوند.
این آزمایش فرصتی فراهم می نماید تا با زاویه ای تازه به رابطه میان ادراک، حافظه و تفسیر نگاه کنیم. هوش مصنوعی هنگام بازسازی تصویر، هر بار آن را از نو درک می نماید و همین برداشت دوباره کوچک باعث ایجاد انحرافی می شود که در چرخه های بعدی تقویت می شود. مانند هنرمندی که هر بار قلم را کمی متفاوت تر روی بوم می گذارد، مدل نیز ناخواسته مسیر تغییر را ادامه می دهد.
1 - ساختار ادراک تصویری در هوش مصنوعی و چرایی تغییر تدریجی تصویر
ادراک تصویری در مدل های مولد مبتنی بر فرایندی است که به آن بازنمایی نهانی (Latent representation) گفته می شود. مدل، تصویر را پیکسل به پیکسل کپی نمی نماید بلکه آن را به یک فضای فشرده از الگوها، روابط و احتمالات تبدیل می نماید. این فضای نهانی مانند نقشه ای ذهنی است که مدل از تصویر می سازد. بنابراین وقتی مدل تصویر را بازمی سازد، در واقع دارد این نقشه را به زبان پیکسل ترجمه می نماید. اگر این ترجمه در هر چرخه اندکی متفاوت شود، انحراف کوچک به صورت تجمعی رشد می نماید و تصویر نهایی با نسخه اولیه فاصله می گیرد.
در تکرارهای پی درپی، مدل هر بار خروجی خود را دوباره تفسیر می نماید. این فرایند شبیه بازی تلفنی است که بچه ها انجام می دهند؛ جمله ای ساده از دهانی به دهان دیگر منتقل می شود و در سرانجام، نسخه ای شگفت انگیز و گاه کمدی ظاهر می شود. مدل نیز در هر مرحله از بازتعبیر خود اثر می پذیرد. انحراف های کوچک، حاصل محدودیت ها، احتمالات و تکیه گاه های مدل در فضای نهانی اند و با گردش های پی درپی، برجسته تر می شوند. این همان پدیده ای است که به تغییر تدریجی تصویر می انجامد.
2 - نقش حافظه مصنوعی و پدیده انباشته شدن خطا در بازسازی تصویری
در مدل های مولد، حافظه به معنای انسانی وجود ندارد. اما چیزی شبیه حافظه عملکردی (Working memory) در جریان بازنمایی نهانی عمل می نماید. هنگامی که تصویر برای بار دوم وارد مدل می شود، نقطه شروع آن خروجی قبلی است، نه داده اولیه. همین تغییر نقطه شروع باعث می شود که کوچک ترین تفاوت ها در چرخه بعدی تقویت شوند. این پدیده با مفهوم خطای تجمعی (Error accumulation) قابل شرح است، مفهومی که در علوم شناختی، مهندسی تصویر و شبکه های عصبی مشترک است.
مدل هر بار کوشش می نماید تصویری وفادار فراوری کند، اما چون وفاداری در زبان احتمالات تعریف می شود، نه در وجود یک نسخه مرجع پیکسلی، انحراف ناگزیر است. وقتی این انحراف ها لایه لایه روی هم قرار می گیرند، تصویر نهایی شکلی تازه می یابد. این حالت می تواند به تغییر بافت، دفرمه شدن خطوط، جابه جایی نور، یا حتی تغییرات ظریف در حالت چهره بینجامد. همین انباشت آهسته و بی صداست که آزمایش را مجذوب نماینده و گاه هولناک می نماید.
3 - چرا انسان نیز در تکرار خاطره یا روایت دچار دگرگونی ناخواسته می شود؟
پدیده ای که در هوش مصنوعی دیده می شود، شباهت عمیقی با کارکرد حافظه انسان دارد. در روان شناسی شناختی، اصل بازسازی حافظه (Memory reconstruction) بیان می نماید که انسان ها هر بار که یک خاطره را روایت می نمایند، در حقیقت آن را دوباره می سازند نه اینکه از یک انبار ثابت بیرون بکشند. مغز انسان مانند مدل زبانی، از الگوها، تداعی ها و شبکه های معنایی برای بازسازی واقعیت بهره می گیرد. بنابراین تفاوت های کوچک در هر بازگویی، بخشی طبیعی از حافظه انسانی است.
روانپزشکان این روند را در پدیده هایی مانند تحریف خاطره، ساخت زدایی تدریجی و تاثیر عاطفه بر حافظه آنالیز نموده اند. انسان ها همچون مدل های مولد، در هر بازتعبیر مقداری از برداشت کنونی خود را وارد خاطره می نمایند. بنابراین تکرار، نه تنها بازفراوری نیست بلکه فرایندی از نوآفرینی ذهنی است. همین امر است که به مرور تغییراتی ایجاد می نماید که گاه خود فرد نیز متوجه آن نمی شود.
4 - چگونه تغییر تدریجی تصویر می تواند استعاره ای برای تغییر اجتماعی و شکل گیری واقعیت های نادرست باشد؟
آنچه در دنیای هوش مصنوعی رخ می دهد، شباهتی عجیب به فرایند انتقال روایت ها در جامعه دارد. در علوم اجتماعی، مفهوم واقعیت نادرست تجمعی شرح می دهد که چگونه یک روایت کوچک در طول ده ها بازگویی می تواند به حقیقتی کاملاً متفاوت تبدیل شود. هر روایت نماینده، مسئله را بر اساس برداشت، حافظه و زمینه ذهنی خود تغییر می دهد. درست همان طور که مدل هوش مصنوعی، تصویر را در هر چرخه اندکی تغییر می دهد، جامعه نیز هر نسخه از روایت را با افزودن یا کاستن عناصر، دگرگون می نماید.
این پدیده در فرهنگ ها، تاریخ شفاهی، شایعات و حتی افسانه سازی سیاسی مشاهده شده است. تغییرات کوچک، در شروع بی اهمیت و ناپیدا هستند اما نسل بعدی روایت را از نسخه دگرگون شده می آموزد نه از نسخه نخست. بنابراین خطاها انباشته و تثبیت می شوند. همچون چرخه بازفراوری تصویر، در جامعه نیز واقعیت آشکارا تغییر نمی نماید بلکه ذره ذره و تدریجی دگرگون می شود تا جایی که نسخه نهایی با واقعیت اولیه شباهت اندکی دارد.
همان طور که مدل هوش مصنوعی تصویر را در هر چرخه اندکی متفاوت تر بازمی سازد، جامعه نیز روایت ها را آرام آرام تغییر می دهد. در نتیجه واقعیتی تازه شکل می گیرد که از نظر جامعه معتبر است اما با حقیقت اولیه فاصله دارد. این روند در شکل گیری افسانه های شهری، سوءبرداشت های تاریخی و تبلیغات رسانه ای مشاهده شده است. جامعه به شکلی طبیعی تمایل دارد روایت ها را هم سو با ساختارهای هویتی خود بازسازی کند. این شباهت میان هوش مصنوعی و جامعه، استعاره ای عمیق برای فهم فرایند واقعیت سازی است. آنچه در نگاه اول واقعی به نظر می رسد، شاید نسخه ای تکامل یافته از صدها بازفراوری در طول زمان باشد.
مقایسه سه لایه تکرار: هوش مصنوعی، حافظه انسان و انتقال اجتماعی روایت ها
| لایه تکرار | سازوکار دگرگونی | پیامد نهایی |
|---|---|---|
| تکرار تصویری در هوش مصنوعی | رانش معنایی، بازنمایی نهانی، خطای تجمعی | تغییر تدریجی چهره و شکل گیری نسخه ای خیال گون |
| تکرار خاطره در انسان | بازسازی حافظه، اثر احساسات، تغییر زمینه ادراکی | دگرگونی روایت شخصی و فاصله گرفتن از واقعیت اولیه |
| تکرار اجتماعی روایت ها | بازگویی نسل به نسل، حذف و افزودن جزئیات، سازگاری فرهنگی | ساخته شدن واقعیت های نادرست اما پذیرفته شده جمعی |
خلاصه نهایی
ادراک تصویری هوش مصنوعی نشان می دهد که بازفراوری یک تصویر نه فرایندی مکانیکی بلکه تفسیرمحور است و مدل در هر چرخه معنای تازه ای از چهره می سازد. این تغییرات کوچک با هر بازسازی تقویت می شوند و در سرانجام، تصویری که فراوری می شود با نسخه نخست فاصله ای آشکار پیدا می نماید. روندی که در مدل می بینیم، در حافظه انسان نیز وجود دارد و مغز در هر بازگویی، روایتی تازه می سازد که با نسخه اولیه یکسان نیست. تکرار مداوم یک خاطره یا فکر، آن را از ساختار اصلی دور می نماید و گاه به منبعی برای تحریف ادراک فرد تبدیل می شود. جامعه نیز در انتقال روایت ها همین مسیر را طی می نماید و با تکرار نسل به نسل، معنای اولیه ماجرا تغییر می یابد. همین الگوی مشترک در هوش مصنوعی، روان شناسی و جامعه شناسی نشان می دهد که تکرار، برخلاف تصور عمومی، فرایند تثبیت نیست بلکه سازوکار تغییر است. نتیجه اینکه در دنیا دیجیتال امروز، باید نسبت به فاصله میان نسخه اولیه و نسخه بازفراوریشده واقعیت هوشیارتر باشیم.
سؤالات رایج (FAQ)
1. چرا هوش مصنوعی نمی تواند یک تصویر را دقیقاً کپی کند؟
زیرا مدل تصویر را در قالب بازنمایی نهانی تحلیل می نماید نه در قالب پیکسل های ثابت. بازسازی از این فضا همواره اندکی تفاوت ایجاد می نماید.
2. آیا تغییر تدریجی تصویر نشانه خطا است؟
خیر، نتیجه طبیعی فرایند تعبیر و بازفراوری مدل است. مدل به جای کپی برداری، ترکیبی از معنا و الگوهای احتمالاتی را بازسازی می نماید.
3. آیا حافظه انسان نیز مانند مدل هوش مصنوعی دچار تحریف می شود؟
بله. در هر بازخوانی، مغز حافظه را بازسازی می نماید و این امر باعث تغییر تدریجی خاطره می شود.
4. چرا تکرار اجتماعی روایت ها باعث شکل گیری واقعیت های نادرست می شود؟
زیرا هر فرد روایت را با افزودن یا حذف جزئیات منتقل می نماید. این تغییرات کوچک در نسل های بعدی تبدیل به تفاوت های بزرگ می شود.
5. آیا می توان روند تغییر تدریجی تصویر را کنترل کرد؟
تا حدی بله، با استفاده از قیود سخت گیرانه یا مدل های تخصصی. اما تغییر کامل ناپذیر نیست چون مدل همچنان تفسیر می نماید.
6. چه ارتباطی میان تغییر تصویر در هوش مصنوعی و تحریف تاریخی وجود دارد؟
هر دو نتیجه چرخه های تکرار هستند که جزئیات را در طول زمان تغییر می دهند. الگو یکسان است اما بستر متفاوت.
دکتر علیرضا مجیدی
پزشک، نویسنده و بنیان گذار وبلاگ خبرنگاران
دکتر علیرضا مجیدی، نویسنده و بنیان گذار وبلاگ خبرنگاران .
با بیش از 20 سال نویسندگی ترکیبی مستمر در زمینهٔ پزشکی، فناوری، سینما، کتاب و فرهنگ.
باشد که با هم متفاوت بیاندیشیم!
دربارهٔ علیرضا مجیدی در خبرنگاران