Ученые предложили оказаться от традиционных "научных рейтингов" в
пользу метода, запатентованного компанией Google для ранжирования
веб-страниц, сообщает Physics Web.
Технологию PageRank сотрудники
Брукхэвенской лаборатории и Бостонского университета применили к 353
тысячам статей, опубликованных в журнале Physical Review с 1893 по 2003
годы.
Поисковый робот перемещается между страницами методом "случайных
блужданий": с равной вероятностью он выбирает либо произвольную ссылку
из документа, где находится сейчас, либо произвольный документ из
полного списка. Технология Pagerank предполагает, что в "блужданиях"
участвует достаточно много роботов - и ранжирование прекращается тогда,
когда количество приходящих и уходящих роботов в каждой точке
"пространства поисков" уравнивается. Самые "густонаселенные" страницы
выносятся наверх рейтинга.
Исследователи утверждают, что такой метод более удобен, чем
подсчет прямых ссылок. Хотя "индексы цитируемости" и повторяют в первом
приближении "рейтинг Google", он, по словам ученых, точнее выявляет
ценность отдельного результата. Так, у ряда статей нобелевских
лауреатов (Вигнера, Гелл-Манна, Глаубера и других) "индекс Google"
намного выше традиционного: большая часть ссылок приходится на работы,
написанные по их следам и доступно разъясняющие трудные места. Для
робота подобные тексты оказываются "промежуточным пунктом", и дойти до
первоисточника не составляет труда.
Украина сегодня |