Магията на големите данни

Може ли „Кеймбридж Аналитика“ да е променила хода на изборите

 

В последната седмица се разрази яростен скандал с английска фирма, занимаваща се с прогнозиране и анализи, на име “Кеймбридж Аналитика”.* Основният “център” на скандала всъщност е социалната мрежа Фейсбук, тъй като според журналистическото разследване на Канал 4 е предоставила на трета страна („Кеймбридж Аналитика“) личните данни на 50 млн. потребители, което освен че е чудовищно неетично, е дало възможност тези потребители да бъдат “облъчвани” с въздействащи конкретно на тях предизборни послания.

По темата бяха изписани множество текстове и коментари, но в конкретния ще се спрем на един аспект, който остана (обяснимо) в сянката на етичните проблеми и той е какво стои зад идеята на модела на „Кеймбридж Аналитика“ и доколко изобщо е възможно тази идея наистина да се приложи в действителност.

Кейбридж

Кейбридж

Магията на големите данни

Според журналистическото разследване, цитирано по-горе, директорът на “Кеймбридж Аналитика” е обещал на журналистите (представящи се за потенциални клиенти), че е в състояние да направи подробна разбивка на това как биха гласували потенциалните избиратели, извличайки го от техните лични данни. Доколко и как е възможно това?

Големите данни

Големите данни

Развитието на дигиталните технологии в последните години даде възможност за натрупване и архивиране на голямо количество информация в дигитален, т.е. удобен за анализ вид. Съществуват статистически и математически модели за анализ на подобна информация, които дават възможност за откриване и най-важното, прогнозиране на различни тенденции в поведението на потребителите, като да речем да се открие при какви обстоятелства е твърде вероятно потребител, отговарящ на определен профил да е такъв, който желае да не бъде клиент повече на тази компания. Поради това, ако вие сте сред тях е много вероятно да получите „изненадващо“ обаждане от кол-центъра на съответната компания с изгодно предложение, което да ви накара да размислите. Това „изненадващо“ обаждане е направено именно на база на разпознаването ви като част от групата на потенциалните напускащи. Разбира се, правенето на подобни модели не става на магически принцип; освен съответната квалификация на специалистите, които да ги създадат, моделът изисква да са събрани подходящи данни за целта. Големите данни представляват именно подобни бази с информация за отделните единици (клиенти на компании или избиратели или членове на организации). Несъмнено „Кеймбридж Аналитика“ е имала подходящите специалисти, но как се е сдобила с подходящите данни?

Придобиването на големи данни

Дори от краткото обяснение по-горе следва, че за подобни модели са важни не толкова личните данни, колкото данните за поведението и реакциите на потребителите в съответната насока. (Разбира се, личните данни от  типа на пол, възраст, местоживеене също са ключов елемент от моделиране на поведението на потребителите).  За събирането на подобен вид данни обаче не е необходимо потребителите просто да са “регистрирани” някъде с минимум информация, а да отговорят на въпроси, свързани с техните предпочитания. И тук идва нередният момент с подхода на  “Кеймбридж Аналитика“, които са получили тези данни, но не като ясно са декларирали пред потребителите си, че правят такова проучване а чрез викторина или тест от типа на “Какъв тип личност сте”**. Единият проблем тук е че тези тестове официално се декларират като тестове за самооценка, от което следва че техните резултати не би трябвало да бъдат използвани от трети страни. От друга страна обаче, попълването на тези тестове става чрез приложение, на първата страница на което винаги присъстват “ситните буквички”, които малко потребители четат и които предупреждават че приложението ще получи достъп до дейността на потребителите в социалната мрежа, до снимките им и до техния кръг приятели.

Добив на данни

Добив на данни

 

Популярното напоследък приложение за снимки във Фейсбук “Виж как ще изглеждаш като холивудска звезда” също е в състояние да извлече такива данни (има същото предупреждение на първата страница) с тази разлика че тук липсва допитване за лични предпочитания. В този смисъл потребителите “доброволно” приемат тази информация за тях да бъде използвана.

Третият проблем е че Фейсбук (според собствената си политика за защита на потребителските данни) не би трябвало да предоставя възможност  за свързани данни. Това накратко означава че вместо тази информация да остане “складирана” във Фейсбук, данните от тестовете и викторините да се свържат с личните данни и да се извлекат от трети страни, които по този начин ще имат възможност за изграждане на пълния профил на тези потребители: нещо с което последните със сигурност не са се съгласявали, а според  журналистическото разследване по темата, в случая на  “Кеймбридж Аналитика“ се е случило именно това. Несъмнено потребителите би следвало да са по-внимателни в разкриването на информация за себе си в социалната мрежа, но в конкретния случай става въпрос за много повече от “въвеждане в заблуждение” относно предоставената информация. Фирмата вече разполага с данните на милиони потребители, техния социален кръг, интерес и предпочитания, а вероятно и с работещ модел за прогнозирането на техния модел на поведение. Тук следва да се направи уточнението, че за да се направят големите данни ефективни и работещи, не е необходимо те да бъдат неетично събрани: нещо, което фирмата е направила, при това с пълното съгласие и съдействие на Фейсбук ***.

Влияние върху изборите

На фона на всички тези етично спорни въпроси , следва да се зададе основният, а именно, наистина ли тази компания е повлияла на американските избори?

Краткият отговор е: и да, и не. Несъмнено създадените модели могат да бъдат ползвани за насочващи реклами и въздействие върху малки групи от потребители (т.е. тяхното въздействие би било далеч по-ефективно). От друга страна обаче, трябва да се вземе предвид, че не всички избиратели са активни интернет-потребители, което означава че тази част от потенциалните избиратели са „необхванати“ от тези похвати.

Изборите в САЩ

Изборите в САЩ

Разбира се, далеч по- сериозният проблем е навлизането в личния свят на потребителите, с чиито данни се е сдобила “Кеймбридж Аналитика“, което повдига въпроса доколко законът за защита на личните данни (не само у нас, а и в засегнатите държави) изобщо е в състояние да защитава личния свят на гражданите. На 25 май влиза в сила нов регламент на ЕС относно защитата на личните данни, който е насочен към увеличаване на рестрикциите на ползването им от трети страни. Реалният ефект от него обаче може да се види най-рано в края на годината.

 

*Повече за разследването на Канал 4 може да се прочете например тук:

РАЗСЛЕДВАНЕ: „Кеймбридж Аналитика” се е месила в изборите на много държави

 

**Повече за механизма на сдобиване с данните е обяснено тук: https://www.dnevnik.bg/sviat/2018/03/22/3150440_kakvo_e_izvestno_dosega_za_skandala_s_keimbridj/

 

***Повече за ролята на Фейсбук в този скандал вж. на: http://news.bnt.bg/bg/a/feysbuk-izpolzval-nepravomerno-lichnite-danni-na-nad-50-mln-dushi

 

 

 

  Публикации, Статии етикети: , , , , , ,   | постоянна връзка, Връзките към материала са забранени, но можете да коментирате.


Коментирай

С вашия email никога няма да бъде злоупотребено. * задължително поле

*
*

Можете да използвате следните HTML етикети и атрибути: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <s> <strike> <strong>

Spam protection by WP Captcha-Free