Присоединяйтесь к нашим группам

Нейросети: теряем, приобретая

Нейросети: теряем, приобретая

Сегодня существуем множество программ, позволяющих изменить и улучшить как аудиофайл, так и любое изображение. Прогресс дошёл и до видео, в котором мы технически уже можем повысить качество и детализацию (да-да, почти как в фильмах про шпионов). Но такое улучшение не всегда идёт на пользу как файлам, так и нам самим – сегодня и в обозримом будущем. Почему?

02 03 2020
23:15

Первой проблемой нейросетей является то, что они часто достраивают то, чего не оригинальных документах не было и быть не могло. Возьмём самый известный пример с фотографией: нейросети, встроенные в современные фотоаппараты и камеры топовых смартфонов, достраивают изображение на основе баз данных и алгоритмов, которые строят предположения, но не имеют 100% уверенности в своих данных. Другими словами, на окнах дома на фоне фотографии могут появиться занавески. Вот только в реальности этих занавесок, а порой и окон, не существует.

Казалось бы, какая разница, какие где висят шторы? Но если эта фотография будет использована в качестве вещественного доказательства при расследовании убийства, это может сбить следствие со следа. И ладно бы проблема была только в этом. Вполне возможно, что «доработанные» кадры рано или поздно станут достоянием истории. И люди будущего будут на их основании воссоздавать нашу сегодняшнюю жизнь. Другими словами, пара незначительных штрихов лёгким движением руки превращаются в искажение истории.

Помимо детализации нельзя обойти вниманием и множество фильтров, программ по сглаживанию и изменению цветов изображения. Улучшения, применяемые в автоматическом режиме, собирают все эти категории.

Но оставим в покое будущее и обратимся к прошлому. Многие важные документы сейчас доступны лишь в отсканированной электронной форме. Это связано с ветшанием бумаги и выцветанием чернил. Вот только сканеры сегодня тоже отличаются умом и сообразительностью. Они вполне могут не только улучшить чёткость изображения, но и стереть «лишнее» или дорисовать что-то от себя (что встречается, конечно, куда реже). В итоге мы можем терять детали и части изображения. С программами по распознаванию текстов ещё хуже – они могут путать буквы, цифры, а также буквы и цифры между собой – и далеко не всегда слово остаётся понятным.

Если говорить только о настоящем, то тут также существуют определенные проблемы. Дело в том, что мы зачастую лишаемся такой ценной вещи, как исходники. Порой приложения просто не спрашивают, а по собственному почину заменяют фотографии их отредактированной версией. И доказывай потом, что тонны фотошопа на лице, размывающие его контуры – не результат осознанных действий, а работа машины.

Бывает, что нейросети ухудшают фотографии. Их работа направлена на то, чтобы картинка была приятна глазу и лучше всего соответствовала заложенным в их базу параметрам. Чаще всего это означает сглаживание изображения и добавление на него дополнительных шумов, имитирующих текстуру объектов. В итоге, чем «умнее» программа, тем сильнее она искажает картинку. Становятся нечитаемыми надписи, редкие логотипы и детали гардероба, изменяются цвета.

Таким образом, улучшение нейросетями вовсе не всегда означает реальное улучшение – зачастую это лишь красивая иллюзия, сильно искажающая факты.

Дмитрий Потапкин, специально для Обзор.press.