Источники данных
Как мы все это выяснили?

1
С сайта Роспечати мы взяли списки для изданий, которые получили субсидии в 2015 году http://fapmc.ru/slabovid/statements/support/recipientsofstate/item48.html http://fapmc.ru/slabovid/statements/support/recipientsofstate/item49.html .

2

Вручную распределили их по группам в соответствии с категориями, которые рекомендует Роспечать http://www.fapmc.ru/rospechat/statements/support/grantingofstatesupport/item41/main/custom/00/02/file.pdf .

3
В реестре СМИ http://rkn.gov.ru/opendata/7705846236-ResolutionSMI/ , который публикует Роскомнадзор, для каждого издания мы нашли ИНН. По ИНН из реестра субсидий http://rs.budget.gov.ru скачали описания всех субсидий данной компании. Компании иногда получают субсидии на несколько проектов, поэтому нужно было разобраться, на какие проекты сколько денег было получено. Для этого мы скачали и прочитали договоры по всем субсидиям, определили, на что сколько денег пошло. В итоге у нас получилась таблица с колонками "издание", "проект", "субсидия", "категория" со всеми субсидиями для СМИ в 2015 году.

4

На сайте с закупками http://clearspending.ru/ мы нашли все контракты, в которых есть подстроки «пропаганда», «популяризация», «воспитание» или «имидж». Посмотрели, какие коды ОКПД чаще всего встречаются и немного их обобщили их с помощью реестра кодов http://www.gov-zakupki.ru/cody/okpd/92.20.1 .



5

Затем скачали все контракты за 2015 год для всех издательств, которые присутствуют в реестре СМИ. С помощью набора простых правил автоматически разбили контракты на группы. В результате у нас получилась таблица к колонками «издание», «предмет контракта», «стоимость», «категория».


Весь код и данные доступны на https://github.com/alexanderkuk/media-hack



Made on
Tilda