Войти как пользователь
Вы можете войти на сайт, если вы зарегистрированы на одном из этих сервисов:
< >
1 2 3 4 5

PageRank

Математичний рейтинг вебсторінки (PageRank) для простої мережі, виражений у відсотках (Google використовує логарифмічну шкалу ). Вебсторінка C має більш високий рейтинг, ніж сторінка E, хоча є менше посилань на C, ніж на Е, але одна з посилань на C виходить з важливіших сторінок і, отже, має більш високе значення. Якщо умовно вважати, що веб-користувач, який знаходиться на випадковій сторінці, має 85% ймовірність вибору випадкової посилання на поточній сторінці, і 15% переходу на будь-яку іншу сторінку, то ймовірності переходу на сторінку E з інших посилань дорівнює 8,1% часу . (15% ймовірності переходу до довільної сторінці відповідає коефіцієнту загасання 85%.) Без загасання все веб-користувачі в кінцевому підсумку потрапляють на сторінки A, B або С, і всі інші сторінки будуть мати PageRank, рівний нулю. При наявності загасання сторінка А ефективно пов'язує майже всі посилання на сторінки в цій Мережі, навіть якщо вона не має своїх власних вихідних посилань.

PageRank ( «Пейдж-ранк»; від англ. Page rank - ранг сторінки) - один з алгоритмів посилального ранжирування . Алгоритм застосовується до колекції документів, пов'язаних гіперпосиланнями (таких як веб-сторінки з всесвітньої павутини ), І призначає кожному з них якийсь чисельне значення, що вимірює його «важливість» або «авторитетність» серед інших документів. Взагалі кажучи, алгоритм може застосовуватися не тільки до веб-сторінок, але і до будь-якого набору об'єктів, пов'язаних між собою взаємними посиланнями, тобто до будь-якого графу .

PageRank - це числова величина, що характеризує «важливість» веб-сторінки. Чим більше посилань на сторінку, тим вона «важливіше». Крім того, «вага» сторінки А визначається вагою посилання, переданої сторінкою B. Таким чином, PageRank - це метод обчислення ваги сторінки шляхом підрахунку важливості посилань на неї.

У 1996 році Сергій Брін і Ларрі Пейдж , Тоді ще аспіранти Стенфордського університету , Почали роботу над дослідницьким проектом BackRub [1] - пошуковою системою по Інтернету, що використовує нову тоді ідею про те, що веб сторінка повинна вважатися тим «важливіше», чим більше на неї посилається жодна стаття, і чим більше «важливими», в свою чергу, є ці сторінки. [2] Через деякий час BackRub була перейменована в Google . Перша стаття з описом застосовується в ній алгоритму ранжирування, названого PageRank, з'явилася на початку 1998 року [3] , За нею слідом вийшла і стаття з описом архітектури самої пошукової системи. [4]

Їх система значно перевершувала всі існуючі тоді пошукові системи, і Брін з Пейджем, усвідомивши її потенціал, заснували у вересні 1998 року компанію Google Inc. , Для подальшого її розвитку як комерційного продукту.

З тих пір алгоритми і математичні моделі, що застосовуються при ранжируванні в Google, значно покращилися. В інтерв'ю в 2007 році Аміт Сингхал , Представник відділу якості пошуку Google, заявив, що їх пошукова система використовує понад 200 ранжирують сигналів , Лише одним з яких є PageRank, [5] але він до цих пір грає істотну роль в пошукових продуктах Google. [6] Варто зазначити, що алгоритм PageRank, в тому вигляді, в якому він був викладений Пейджем в статті 1998 року [3] , Може бути поліпшений в деяких практичних аспектах (наприклад, посиланням можуть призначатися різні ваги), і алгоритми, що застосовуються в сучасних пошукових системах, є скоріше лише його варіантами.

PageRank можна перекласти з англійської мови як «ранг сторінки», проте Google Inc. пов'язує слово Page в назві алгоритму лише з англійським словом «сторінка», а з ім'ям Ларрі Пейджа ( англ. Larry Page). [7]

Назва «PageRank» є торговою маркою компанії Google Inc. Алгоритм запатентований в США 4 вересня 2001 року [8] , Як винахідника алгоритму в патенті зазначений Ларрі Пейдж. Офіційним власником патенту є не Google Inc., а Стенфордський університет , В якому навчалися Ларрі Пейдж і Сергій Брін в момент подачі заявки на патент.

У 1998 році Google був однією з перших пошукових систем, що впровадили ранжирування посилань, завдяки чому домігся значного поліпшення якості пошуку в порівнянні з конкурентами. Надалі багато великих пошукові системи розробили і впровадили свої аналоги PageRank і інші методи статичного (тобто запити-незалежного) ранжирування документів.

Останнє оновлення Google PageRank сталося 6 грудня 2013 року. [10]

16 квітня 2016 року компанія Google офіційно прибирає цей показник і обнуляє PageRank у всіх сайтів.

10 січня 2018 року закінчився термін дії патенту на винахід US6285999, однак PageRank все ще охороняється як товарна марка.

Скульптування PageRank ( англ. PageRank sculpting) - маніпулювання кількістю PageRank, переданого через конкретні посилання сторінкою N інших сторінок за допомогою присвоєння одній або декільком посиланнях, що йде з цієї сторінки, атрибута nofollow , Що призводить до утримання більшого PageRank ( «ваги») на сторінці N з метою подальшої його передачі потрібних сторінок.

В 2009 році Метт Каттс заявив, що скульптування PageRank більше не працює, так як тепер постановка будь-яких посилань (як з атрибутом nofollow, так і без нього) призводить до рівномірного розподілу переданого PageRank ( «ваги») між вихідними посиланнями. [11]

Надбудова для браузера Google Toolbar показує для кожної веб-сторінки ціле число від 0 до 10, яке вона називає PageRank, або важливістю цієї сторінки з точки зору Google. Однак механізм його розрахунку і що в точності позначає це значення, не розкривається. За деякими даними, ці значення оновлюються лише кілька разів на рік (в той час, як внутрішні значення PageRank перераховуються безперервно [12] ) І показують значення PageRank сторінок на логарифмічною шкалою. [13]

З 2016 року Google офіційно відключив «тулбарний» показник PageRank, після чого дізнатися значення PR з браузерів і інших інструментів стало неможливо [14] , Проте можна дізнатися історії значення PR різних сайтів до цієї дати.