Microsoft тихомълком изтри базата си данни от 10 млн. снимки на лица
Абонирайте се за Капитал

Всеки петък икономически анализ и коментар на текущите събития от седмицата.
Съдържанието е организирано в три области, за които Капитал е полезен:

K1 Средата (политическа, макроикономическа регулаторна правна)
K2 Бизнесът (пазари, продукти, конкуренция, мениджмънт)
K3 Моят капитал (лични финанси, свободно време, образование, извън бизнеса).

Абонирайте се за Капитал

Microsoft тихомълком изтри базата си данни от 10 млн. снимки на лица

Главният изпълнителен директор на MIcrosoft Сатя Надела.

Microsoft тихомълком изтри базата си данни от 10 млн. снимки на лица

Данните обаче остават достъпни за компаниите, които са я използвали, включително полицията в Китай, която следи малцинствата

3903 прочитания

Главният изпълнителен директор на MIcrosoft Сатя Надела.

© Sergio Perez


Хората, чиито снимки са използвани, не са питани дали са съгласни компанията да разполага и разпорстранява снимките.

Американският технологичен гигант Microsoft тихомълком изтри от интернет пространството своята база данни MS Celeb, съдържаща информация за 10 млн. лица. Според самата компания това е най-голямата достъпна публична мрежа за лицево разпознаване, тъй като разполага с 10 млн. снимки на близо 100 хил. души. Проблемът обаче е, че MS Celeb е била използвана от различни системи за разпознаване по целия свят, включително за нуждите на военните разузнавателни служби и китайски компании като SenseTime и Megvil.

За академични цели?

Хората, чиито снимки са използвани, не са питани дали са съгласни компанията да разполага и разпорстранява снимките. Файловете са взимани от интернет чрез търсачки и видеа, които попадат под лиценза за защита на авторските права Creative Commons. Той обаче дава възможност за повторното им използване, но само за академични цели.

Microsoft, която свали данните си няколко дни след като Financial Times съобщи за употребата им от други компании, коментира, че предназначението им е било именно с такава цел."Базата се е управлявала от служител, отстранен от Microsoft след премахването ѝ", казват от компанията.

Два други масива данни също са били изтрити, включително тези от наблюдение Duke MTMC, направени от изследователи от университета Дюк, както и такива, направени от университета в Станфорд - Brainwash.

Brainwash е съдържала снимки на клиенти от кафе, носещо същото име, в един от кварталите на Сан Франциско, като ги взима от камера, предаваща на живо. От университета Дюк отказват коментар пред FT, а от Станфорд обясняват, че се премахнали данните по молба на един от авторите на проучването, за което са използвани.

В ръцете на другите

Общо трите масива данни са били разследвани от берлинския изследовател Адам Харви. Неговият проект Megapixels документира детайли относно няколко масива данни и начина, по който се използват. MS Celeb на Microsoft например е от полза на няколко търговски организации, става ясно от данни на технологични фирми като IBM, Panasonic, Alibaba, Nvidia, Hitachi, Sensetime и Megvii.

От тях Sensetime и Megvii са китайски компании, които доставят оборудване за служители в провинцията Синдзян, където предимно мюсюлмански малцинства като уйгури се следят с камери и други технологични устройства. После голяма част от тях са пращани в лагери.

Китайската връзка

Megvii наскоро привлече 750 млн. долара финансиране, а нейното приложение за лицево разпознаване е Face ++. То е посочено в доклад на организацията Human Rights Watch като доставчик на интегрираната съвместна операционна платформа IJOP в Китай, пише Gizmodo. Тя се използва от полицията в Синдзян, за да следи местното население - това става най-вече чрез камери и смартфон приложение, което дава данни за всяко лице в региона и формира мисии за агентите при засечено подозрително поведение.

След промени в доклада обаче групата е посочила, че всъщност Face +++ никога не е било използвано.

Самата Microsoft използва данните, за да тренира алгоритми за лицево разпознаване, става ясно от проучването на Харви. Името им Celeb цели да подскаже, че фокусът е върху снимки на известни личности.

Законно ли е?

"Microsoft използва думата celebrity (англ. знаменитост), защото включва хора, които предимно работят онлайн и имат дигитална идентичност", казва Харви. "Много хора от таргет групата са критици на самата технология, която Microsoft използва", добавя той.

Преди проучването на FT да излезе обаче, те не са знаели, че техните лица участват в базата данни. "В никакъв случай не мога да се нарека публична личност, затова няма да се откажа от правото си на лична неприкосновеност", твърди Адам Грийнфилд, който е технологичен писател и урбанист, включен в масива.

Според технологични експерти Microsoft е в нарушение на регламента за защита на личните данни GDPR, тъй като продължава да доставя данните от MS Celeb, след като мерките вляза в сила миналата година.

Въпреки че базата данни е изтрита от Microsoft, тя все още е достъпна за изследователи и компании, които преди това са я изтеглили. Харви заяви, че отвореният ѝ код още е наличен на някои уеб сайтове.

Вднъж достъпни, завинаги достъпни

"Не можете да изтриете база данни. След като сте я публикували веднъж и хората са я изтеглили, вече я има на различни твърди дискове по целия свят, "обяснява той. "Сега тя е независима от лицензите, правилата или контрола, който преди Microsoft упражняваше, а това значи, че хората вече могат да я публикувате в сайтове като GitHub, като съхраняват файловете в Dropbox и Baidu Cloud, така че няма начин да ги спрете да продължат да я публикуват и да го използват за свои собствени цели", обобщава той.

Хората, чиито снимки са използвани, не са питани дали са съгласни компанията да разполага и разпорстранява снимките.

Американският технологичен гигант Microsoft тихомълком изтри от интернет пространството своята база данни MS Celeb, съдържаща информация за 10 млн. лица. Според самата компания това е най-голямата достъпна публична мрежа за лицево разпознаване, тъй като разполага с 10 млн. снимки на близо 100 хил. души. Проблемът обаче е, че MS Celeb е била използвана от различни системи за разпознаване по целия свят, включително за нуждите на военните разузнавателни служби и китайски компании като SenseTime и Megvil.


Благодарим ви, че четете Капитал!

Вие използвате поверителен режим на интернет браузъра си. За да прочетете статията, трябва да влезете в профила си.
Влезте в профила си
Всеки потребител може да чете до 10 статии месечно без да има абонамент за Капитал.
Вижте абонаментните планове

1 коментар
  • 1
    mickmick avatar :-|
    mickmick

    Фейсбук, Гугъл.. Инстаграм и другите да не би да има по-малки бази данни със снимки?


Нов коментар

За да публикувате коментари,
трябва да сте регистриран потребител.


Вход

Още от Капитал

С използването на сайта вие приемате, че използваме „бисквитки" за подобряване на преживяването, персонализиране на съдържанието и рекламите, и анализиране на трафика. Вижте нашата политика за бисквитките и декларацията за поверителност. OK