ВСЕ новости СЕГОДНЯ
RSS.+ — история VIP в новостях News24 с календарным архивом. Все самые быстрые 24/7 новости в ежеминутном тематическом обновлении Life24 — на русском, и не только + Today24, а также тексты с озвучкой — в авторском разделе #123ru.net
Ria.city

Вжух – и ваш паспорт утек в Интернет. Как IT-стартап Dbrain незаконно собирает личные данные россиян, притворяясь ИИ

Атон Игнатенко.  

Когда в апреле этого года прогремела новость о том, что в супермаркетах Amazon у покупателей товары считывали не умные камеры, а 1000 индийцев, многие СМИ и Интернет-пользователи возмущались “грандиозным ИИ-обманом” мегакорпорации. Между тем в России есть компания, пытающаяся продавать решения, которые только притворяются искусственным интеллектом, – Dbrain.

Краудсорсинговый сервис распознавания документов Dbrain, резидент Сколково, не раз критиковали за то, что у него обработкой документации вместо искусственного интеллекта занимаются неизвестные операторы. Недавно в компании вновь заявили о том, что их распознавание – автоматическое и основано на “собственных нейросетях”, и предложили всем желающим протестировать работу сервиса, отправив фото своего паспорта и других личных документов в Telegram-бот сервиса. Однако качество распознавания оказалось столь неудовлетворительным, что только подтвердило неэффективность продуктов Dbrain – и в этом мы убедились на собственном опыте. Не говоря о том, что сама процедура сбора данных через бот откровенно нарушает федеральный закон №152-ФЗ “О персональных данных”. Но обо всем по порядку.


Предложение, от которого невозможно отказаться

Напомним, что краудсорсинговый сервис выступил с заявлением о работе своих продуктов на фоне разразившегося скандала вокруг нашумевшего криптовалютного кликера Hamster Kombat. После того, как Интернет заполонили сообщения разъяренных геймеров, которые на “тапании хомяка” планировали заработать миллионы, а получили всего несколько долларов, в одном из крупных Telegram-каналов вышел пост, посвященный одному из создателей игры и по совместительству “серийному предпринимателю” Эдуарду Гуриновичу. Среди прочих афер неудачливого бизнесмена в публикации упоминался и Dbrain, выдающий себя за разработчика ИИ, но на деле в открытую использующий труд анонимных операторов.

В Dbrain предприняли попытку опровергнуть обвинения в ручной обработке документов и предложили всем желающим протестировать работу систем сервиса, воспользовавшись специальным демо-ботом в Telegram под сомнительным названием “Вжух – и распозналось”. В обращении клялись показать “автоматическое распознавание за 1–2 секунды, что вручную выполнить невозможно”. Воспользоваться ботом можно бесплатно, на это отводится несколько попыток. Пользователь должен отправить скан или фотографию личного документа, а затем через время ему присылается сообщение со всеми распознанными данными.

Мы решили проверить, насколько правдива похвальба разработчиков Dbrain, и протестировали распознавание на разных документах – нескольких разворотах паспорта и свидетельстве о рождении. Все это мы нашли в Интернете, потому что отправлять личные данные неизвестно куда, напомним, – опасно. А никакой конфиденциальности бот вам предсказуемо не гарантирует.

Вжух – и не распозналось

Первым неприятным сюрпризом было время распознавания – разработчик обещал всего “1-2 секунды”, а в действительности ждать пришлось 1-2 минуты. Например, изображение центрального разворота паспорта РФ, взятое из Википедии, было отправлено в 17:55, а сообщение с распознанными данными пришло только в 17:57.

Была надежда, что долгая обработка документа будет хотя бы компенсироваться высоким качеством распознавания, но куда там. Город Архангельск, указанный в поле “место рождения”, вдруг стал “А7нгель”. Еще не была извлечена дата рождения “12.09.1682”, а в поле “МУЖ.” потерялась точка.

Указанные просчеты уже подтвердили часть сомнений насчет ИИ Dbrain, но поскольку остальные данные были распознаны верно, было решено продолжить эксперимент. Для одной из попыток мы взяли российский паспорт Барака Обамы отсюда.

С этим документом ситуация с длительным ожиданием повторилась. Например, изображение паспорта было отправлено в 18:15, распознанные данные пришли в 18:16. Обещанных 1-2 секунд опять не было.

Со вторым пошла полная фантазия и начались галлюцинации: бот начал не просто игнорировать некоторые поля и допускать ошибки в словах, а буквально выдумывать новые данные  Так, в другом фейковом паспорте, изображение которого было отправлено на обработку, владелец документа из Александровича вдруг стал Владимировичем. Серию и номер паспорта бот также “додумал”, выдав вместо видимого ряда единиц 9311 447826. С кодом подразделения, датой рождения и выдачи сервис Dbrain поступил аналогично.

Причем все “придуманные” данные бот взял из нижней части страницы с фото (называется она MRZ). Никакой сверки хваленая система, разумеется, не провела. Как и не поставила пробелов между словами “УФМС” и “России”, “по” и “Омской”.

Фантазии ИИ не знают границ

После основного разворота паспорта было решено отправить боту страницу с пропиской, взятую из ВКонтакте (серию и номер паспорта мы специально скрыли). Тем более там встречаются рукописные данные, и было любопытно узнать, справится ли с ними бот Dbrain. Как и ожидалось, распознавание вновь растянулось на несколько минут, и на отправленный в 18:26 файл система отреагировала только в 18:28. Видно, заявленной скорости обработки документа дождаться было не суждено.

Бот не распознал дату регистрации и выдавший документ орган, из адреса регистрации смог корректно выдать по сути лишь одно слово. Из напечатанной информации на изображении об органе, поставившем штамп, и написанного в нем от руки адреса бот придумал новый адрес и новый город в Московской области – СЕОГОМСК.

Под конец боту было отправлено свидетельство о рождении, взятое из Википедии. Ситуация не изменилась: в одном слове могло быть по несколько ошибок, а отдельные наименования превратились в какую-то тарабарщину. Например, мать владельца документа из Турсуновой Евгении Сергеевны стала Тирсуновой Еваенией Серзеевной. А орган, выдавший свидетельство, превратился в “опел.Загс Дерожкинеского рабона2. Новосибцрска уравления ло Оебламй ЗАС Нвсибдрскай область”.

На этом фантазия бота не остановилась, и в месте рождения он откуда-то взял СНТ Родина и строение 5А, по пути потеряв целую Новосибирскую область, а также, что более важно, – дату выдачи и серию документа.

По итогу мы имеем сервисного бота, который допускает ошибки не только на фотографиях, но и на сканах хорошего качества. Порой сервис Dbrain не распознает целые строки документов, а в ряде случаев  начинает выдавать то, чего в документах просто нет. Причем это происходит и тогда, когда придуманная им информация (ФИО, серии с номерами и прочие данные) четко видна на изображениях.

Возникают вопросы – почему сервис, с апломбом заявляющий о своих технологиях, не справился с такими простыми задачами? Речь про автоматическое распознавание печатного текста в паспорте. Может быть, проблема кроется не в технологиях, а глубже? В своем комментарии Dbrain обрисовали два пути: автоматическое распознавание и ручной ввод неизвестными операторами Яндекс.Заданий. Автоматическая обработка, как показала практика, у Dbrain совершенно бессильна даже против элементарных образцов. Выходит, вообще вся работа по вводу данных осуществляется людьми?

Краудсорсер расправил плечи

На самом деле ничего удивительного в этом нет, учитывая, сколько раз представители Dbrain открыто признавали факт привлечения краудсорсинга для распознавания данных паспортов и других документов, как будто бы приучая клиентов к этой мысли на случай утечки данных. Схема ясна: вы присылаете ваши конфиденциальные данные, Dbrain идет на “Яндекс Задания”, и там их вводит неизвестный разметчик. И в этом кроется самая большая опасность. Оператором на платформе может стать фактически любой желающий. Платформе надо, чтобы кто-то вводил данные, а кто именно – дело десятое.

Добавьте к этому то, что за выполнение заданий по вводу данных операторы получают даже не рубли, а копейки, и получите потенциально криминогенную среду, где анонимные краудсорсеры могут делать с присланными данными все, что им заблагорассудится. В том числе продавать документы на черном рынке. С краудсорсингом Dbrain связан явно потому, что их технология не справляется с обработкой даже самых очевидных документов, а операторы-краудсорсеры нужны, чтобы прикрывать ее просчеты. Попытаться исправить ситуацию можно, лишь “натаскав” технологию. Только где взять данные для обучения такой системы?

Здесь Dbrain, судя по всему, решили идти напролом и начали собирать ваши личные данные в открытую – через того самого бота. Эдакий ход “под дурачка” – заставить пользователей самим присылать фото своих документов. Однако заниматься таким без прямого согласия владельца данных попросту незаконно. Краудсорсинговый сервис, собирая через бота фотографии или сканы паспортов, свидетельств и тому подобного, фактически нарушает закон №152-ФЗ. При этом никаких проверок в отношении сервиса не проводилось, а сам Dbrain продолжает пиариться в Telegram-каналах.

Тест бота Dbrain проводился меньше месяца назад, на данный момент бот деактивирован. Выходит, безнаказанно собрали данные и сбежали, пока никто не видит.

Распозналось – и точка?

Таким образом, Dbrain, стремясь утвердиться, что его сервис является полностью автоматическим, продолжает настойчиво убеждать всех в обратном. После его “автоматического” распознавания необходимо проверять каждое слово или номер, а в иных случаях легче самому вбить все данные, чем исправлять множественные ошибки системы.

Но некачественное распознавание – далеко не единственная проблема Dbrain. Сервис позиционирует свои решения как ИИ-продукты, однако по факту в них используются живые люди, и если вы воспользуетесь решениями компании, и передадите в облако Dbrain свои данные, то они окажутся под угрозой. С присланными сведениями может произойти все, что угодно, и последствия могут быть гораздо более серьезными, чем простая ошибка в распознавании.



Все новости по теме на сегодня

Интернет в новостях



Музыкальные новости
Джиган

Дом для «козьей ОПГ»: Джиган и Самойлова построят питомник для бутовских коз



Все новости 24/7

Game News

Call of Duty: Black Ops 6 meta guns and loadouts


Новости 24 часа

В Мытищах состоялась отчетно-выборная конференция профсоюза жизнеобеспечения


News Every Day

Bay Area high school football: Weekend scoreboard, how Top 25 fared



Интернет

В Мытищах состоялась отчетно-выборная конференция профсоюза жизнеобеспечения


Мода

«585*ЗОЛОТОЙ» рассказала о продажах и необычных свойствах украшений с драгоценными камнями

Общество

Все общество

Бизнес

Культура

Спорт

Политика

Авторы

Новости тенниса

WTA

Россиянка Шнайдер с победы стартовала на турнире WTA в Гонконге



Rss.Plus — реально независимые новости по темам (энциклопедический систематизированный навигатор "Википедия новостей 24/7" c ежеминутным тематическим мониторингом интернет-пространства) в форме аполитичного просветительского интернет-журнала на русском языке, без цензуры, на многоязычной международной веб-платформе 103news.com в содружестве с более чем 20 000 источников информации во всём мире, сайтом News-Life.pro, глобальными гео-проектами Ria.City и Moscow.Media под патронажем Russia24.pro с уникальным персонифицированным новостным разделом "Региональная власть РФ" без купюр и модерации, а также "VIP-скандалы" в двух цветовых вариантах "День - Ночь" (кнопка справа вверху). Эти новости увидят Ваши внуки (наша система обеспечивает вечное хранение опубликованной информации 24/7). Будьте честными сегодня, чтобы было не стыдно завтра.

Опубликовать свою новость в любом городе и регионе, а также на любом языке мира можно мгновенно — здесь


Ria.city

В Мытищах состоялась отчетно-выборная конференция профсоюза жизнеобеспечения

Пенсионерам в России напомнили о полагающихся льготах и субсидиях на оплату ЖКУ

Подмосковные почтовые отделения не будут работать 4 ноября

Мокрый снег с дождем обрушится ночью 1 ноября на трассу М-4 «Дон» в Воронежской области

Новости России

Загрутдинов: Завершен монтаж фасадов в школе на Салтыковской улице

Названы самые популярные автомобили у россиян среди новинок 2024 года

Три страны возродят для туристов древний «Великий чайный путь»

Перуанские Деликатесы в Греции

Экология в России и мире

Токсиколог Кутушов объяснил, почему хочется спать после обеда

«Ленком» сообщил, что актер Александр Збруев остается в больнице

Фестиваль «Стенограффия» в Екатеринбурге: большой праздник уличного искусства

Как руководителю организовать день и выжить в потоке созвонов

Спорт в России и мире

Арина Соболенко ударила по голове фотографа. Видео

Рахимова обыграла Приданкину и вышла в 1/4 финала турнира WTA в Цзюцзяне

Блинкова на отказе Цуренко вышла во 2-й круг турнира WTA 250 в Мериде, где сыграет с Корнеевой

Борис Беккер назвал теннисиста с одной из лучших подач в нынешнем ATP-туре

Moscow.media

Уральца будут судить по делу о крупном мошенничестве – от аферистов пострадала московская актриса

В Мытищах состоялась отчетно-выборная конференция профсоюза жизнеобеспечения

Заместитель управляющего Отделением Фонда пенсионного и социального страхования Российской Федерации по г. Москве и Московской области Алексей Путин: «Клиентоцентричность - наш приоритет»

Ноябрьская....

Новости Крыма на Sevpoisk.ru

Ректор Академии Русского балета Николай Цискаридзе на марафоне Знание.Первые поделится личным опытом и расскажет о роли просвещения

Директор певицы Инстасамки рассказал о ее сотрудничестве с лидером «Ленинграда» Сергеем Шнуровым

Тимати Шаламе сорвал конкурс своих двойников: фанаты набросились на актера

Рэпер Джиган и блогерша Самойлова построят питомник для бездомных коз из Бутово

Губернаторы России

На дорогах Подмосковья зафиксирован 1 млн автомобилей утром 31 октября

Подмосковное УФАС пресекло распространение спам-рекламы на телефон бизнесмена

Три страны возродят для туристов древний «Великий чайный путь»

«Академия Холдинг» выпустила новые товары под брендом «Улётная доставка»


Все города России от А до Я

Персональные новости
Чемпионат

Чемпионат России по баскетболу стартовал в Брянске


BigPot.News — быстрые и самые свежие тематические новости об известных личностях в России, в Украине, в Беларусии, в Казахстане и за их пределами в календарном формате 24/7 на основе авторской технологичной информационно-поисковой системы Smi24.net с элементами искусственного интеллекта, гео-отбора и возможностью мгновенной публикации авторского контента в категориях News и Life в режиме Free Public



Больше новостей СЕГОДНЯ


RSS.plus — СРОЧНЫЕ новости. Неоспоримое преимущество RSS.plus — максимальная скорость публикаций 24/7. Быстрее нас, СЕЙЧАС, лишь только — ВЕТЕР Сайт создан под патронажем Россия24.pro — непрерывные новости из регионов 24/7 на русском + новости Москвы от Moscow.Media и мировые новости от Smi24.net и партнёров в календарном формате (вчера, сегодня и сейчас) совместно с 123ru.net и платформой СМИ24.net по технологии 103 NEWS

Опубликовать свою новость в любом городе и регионе, а также на любом языке мира можно мгновенно — здесь







Rss.plus