May 07, 2018

Сегодня с утра новостей довольно много (в том числе с выходных). Поэтому некоторые я собрал в тематические подборки. Вот первая, про Кембридж Аналитику, причем вся из Гардиан:

1. Британский регулятор потребовал от Кембридж Аналитики предоставить все данные на голосовавших американцев. Причем не только данные, но и как они были получены и для чего использовались. Обратите внимание, насколько сложно политически устроено это дело. И насколько глубоко понимающие эксперты привлечены www.theguardian.com/uk-news/2018/may/05/cambridge-analytica-uk-regulator-release-data-us-voter-david-carroll

2. Christopher Wylie описывает в деталях, как CA использовали методы машинного обучения и данные фейсбука для того, чтобы предсказывать поведение пользователей. Вообще этот рассказ похож на школьное описание атомной бомбы: в целом понятно как сделать такое же, но некоторые очень важные детали упущены. www.theguardian.com/news/2018/may/06/cambridge-analytica-how-turn-clicks-into-votes-christopher-wylie

3. И наконец, по общему требованию Фейсбук отключил CA доступ к данным, а сами СА удалили все данные, которые использовались в выборах Трампа. Казалось бы все, все в порядке, но нет, судя по всему CA оставили себе обученные уже модели. По сути с некоторой потерей точности можно восстановить изначальный датасет, но непонятно зачем - обученная модель гораздо лучше www.theguardian.com/uk-news/2018/may/06/cambridge-analytica-kept-facebook-data-models-through-us-election

Я в канале старался про это все не особо писать, но сейчас все из области политики уходит в область технологий - и вот это уже интересно по-настоящему.

UK regulator orders Cambridge Analytica to release data on US voter

In landmark cross-border decision, Information Commissioner’s Office gives company 30 days to comply with David Carroll’s request