Как са разчетени грамите на WikiLeaks

Журналистите на AP извличат ценното съдържание по техника, взета назаем от онлайн търсачките

За да извлекат важната информация от хилядите грами на WikiLeaks, журналистите на Associated Press (AP) се вдъхновяват от работата на онлайн търсачките, обяснява Джонатан Стрей, интерактивен редактор в AP, в презентация пред националния институт за прилагане на компютърни технологии в журналистиката.


Четете неограничено с абонамент за Капитал!

Статиите от архива на Капитал са достъпни само за потребители с активен абонамент.

Абонирайте се

Възползвайте се от специалната ни оферта за пробен абонамент

1 лв. / седмица за 12 седмици Към офертата

Вижте абонаментните планове
3 коментара
  • Най-харесваните
  • Най-новите
  • Най-старите
  • 1
    geoprofi avatar :-|
    Geo
    • - 3
    • + 7

    Открили са топлата вода, и? Търсачка, базирана на BM25 ползват почти всички сайтове, в които опцията "търси", а това е, което описвате в статията. Поддържа се стандартно във всички бази данни от повече от десетилетие. По-усъвършенстваните варианти - BM25 + Proximity Match + Custom решения също навлязоха доста масово последните години и работят перфектно навсякъде, където трябва да се търси в база данни. Не виждам новината...

    Нередност?
  • 2
    pavka14 avatar :-|
    Павел
    • + 2

    "журналистите на AP дават рейтинг за всяка дума. Накратко това е число, което определя съотношението между споменаванията на думата във всички документи и употребата й в един документ." - TF-IDF съществува от доста пред журналистите на AP да го "открият".

    Нередност?
  • 3
    epoc avatar :-|
    epoc

    Е сега на гугъл ще им припари под задниците......

    Нередност?
Нов коментар