С използването на сайта вие приемате, че използваме „бисквитки" за подобряване на преживяването, персонализиране на съдържанието и рекламите, и анализиране на трафика. Вижте нашата политика за бисквитките и декларацията за поверителност. ОK
3 14 юни 2011, 17:47, 3712 прочитания

Как са разчетени грамите на WikiLeaks

Журналистите на AP извличат ценното съдържание по техника, взета назаем от онлайн търсачките

  • LinkedIn
  • Twitter
  • Email
  • Качествената журналистика е въпрос на принципи, професионализъм, но и средства. Ако искате да подкрепите стандартите на "Капитал", може да го направите тук. Благодарим.

    Дарение
    Плащането се осъществява чрез ePay.bg


За да извлекат важната информация от хилядите грами на WikiLeaks, журналистите на Associated Press (AP) се вдъхновяват от работата на онлайн търсачките, обяснява Джонатан Стрей, интерактивен редактор в AP, в презентация пред националния институт за прилагане на компютърни технологии в журналистиката.


За да открият ценното в грамите, журналистите на AP дават рейтинг за всяка дума. Накратко това е число, което определя съотношението между споменаванията на думата във всички документи и употребата й в един документ.

След това репортерите сравняват документи, които имат близки рейтинги, и ги визуализират, за да открият връзки. Така те бързо си създават представа за събитията в Ирак например според това колко пъти се среща ключовата дума "убийство" например.

В опит да намалят времето, в което анализират документите, от AP използват алгоритъм, разработен от Стивън Инграм и Тамара Мунцнер от университета на Британска Колумбия. Чрез него, теобработват стотици хиляди документи за минути.



Техниката има много приложения. Екипът на Джонатан Стрей може да раздели всички документи по признаци. В случая файловете се сортират по трите ключови думи, които се повтарят най-често в тях. Например - "със завързани очи", "крака, ръце" и "отвлечен". След това се визуализират връзките между различните категории.

Те се базират на теми от речника на военните като:

- криминално действие (44.61%)
- вражеско действие (29.47%)
- опасност от взрив (16.72%)
- приятелско действие (6.06%)
- доклад за заплаха (1.18%)
- други (1.11%)

След това изследователите задълбават във всяка категория и търсят ключовите думи, които се повтарят най-често в нея. За криминално действие това са: "със завързани очи", "със завързани ръце", "труп" и "изстрел".

Едно от интересните открития са няколко десетки документи, съдържащи "автомобил-цистерна". От AP сверяват статиите на своите журналисти в същия период, от който датират грамите, и откриват едва четири-пет, съдържащи същата ключова дума. Т.е медиите не са успели да обърнат внимание на всички атентати.

Желанието на Джонатан Стрей е да отвори достъпа до компютърния алгоритъм, така че повече разследващи журналисти да се възползват от методите на AP и така да вършат работата си по-ефективно.
  • Facebook
  • Twitter
  • Зарче
  • Email
  • Ако този материал Ви е харесал или желаете да изразите съпричастност с конкретната тема или кауза, можете да ни подкрепите с малко финансово дарение.

    Дарение
    Плащането се осъществява чрез ePay.bg

31 октомври 2019
София Ивент Център

Конференция HR & Leadership Forum 2019


Кои са ключовите тенденции, които ще трансформират работата на бъдещето?
Включете се във форума на Капитал, за да разберете повече за възможностите от използването на новите технологии на работното място и начините хората да останат ценни в технологичната ера. Ще проследим какви качества ще трябва да притежават на лидерите от бъдещето и кои ще са търсените умения при наемане на служители.

Сред лекторите на събитието ще бъдат:


  • Даниел Съскинд, Balliol College, University of Oxford
  • Джои Прайс, Jumpstart
  • Судир Сасийдаран, LEGO Workplace Design

Конференция HR & Leadership Forum 2019 Запазете билет

Прочетете и това

Дигитални модели Дигитални модели

Кои са новите дигитални иновации от тази седмица

18 окт 2019, 711 прочитания

Заедно и в добро, и в лошо Заедно и в добро, и в лошо

Радомир Миланов, управляващ директор в SAP България, пред "Капитал"

18 окт 2019, 1390 прочитания

24 часа 7 дни
 
Капитал

Абонирайте се и получавате повече

Капитал
  • Допълнителни издания
  • Остъпки за участие в събития
  • Ваучер за реклама
Още от "Технологии" Затваряне
Google поумнява

Технологичният гигант въвежда някои доста полезни (а и приятни) нововъведения в услугата си за търсене.

Още от Капитал
Новите инженери на "Бош"

Германската група направи инженеринг център в София, който разработва технологии за автомобилната индустрия

Истерията за Стратегия за детето: С нами и Бог, и руската пропаганда

Интересите на ултраконсервативни "християнски" организации, руски хибридчици, "патриоти" и политически опортюнисти са прикрити зад огромния шум в социалните мрежи

Решения за софийските проблеми

Какво предлагат кандидатите за кметския пост по ключови за града въпроси

Германия си иска парите

Започва сагата с приемането на бюджета на ЕС за периода 2021 - 2027

Шведска маса в гората

Три места в Швеция, където отглеждат и събират храната си сами по устойчивата формула "от земята в чинията"

Кино: "Близнакът"

Анг Лий опитва екшън трилър от ново поколение

X Остават ви 0 свободни статии
0 / 10