Найчастіше питання до недавнього дослідженню Баден-Бадена - це ніж перевіряти перераховані в статті показники. Я допрацював скрипти, якими проводив аналіз і оформив їх у вигляді додаткових сервісів в bez-bubna.com.
Звертаю особливу увагу: інструменти на стадії альфа-версії. В ході дослідження я вручну вибірково перевіряв коректність парсинга і обробки тексту. Особливих нарікань не було, але це не означає, що з вашим сайтом скрипт теж впорається на ура. Тим більше що при зміні коду і його адаптації під промислові навантаження могли з'явитися помилки. Аналіз тексту - справа тонка!
Протягом декількох тижнів виловлено та усуну основні баги. Так що краще не поспішати з використанням. Але якщо ви відважні і багів не боїтеся - то ласкаво просимо. І не соромтеся писати мені про проблеми.
Адреса: https://bez-bubna.com/panel/tools.php (Потрібно бути залогіненним в сервісі).
На використання інструментів витрачаються ліміти, які потрібно купувати окремо від оплати аудитів. У кінцевій версії ціна 1 ліміту буде від 50 копійок до рубля (в залежності від обсягу покупки). На даний момент ціна знижена до 25 копійок. Чи не тому що прагну побільше продати. Навпаки, зараз готуюся виступати на SEMPRO , Так що наплив користувачів буде мене відволікати. Просто совість не дає брати повну ціну за сирі сервіси.
Тепер коротко про інструменти (докладніше буде потім в довідці).
Аналіз трафіку по сторінках
На екрані налаштування вказуєте дату в минулому, а також за скільки днів брати дані. Сервіс запитує Метрику і порівнює відвідуваність сторінок з Яндекса або Google за вказане число днів до дати і після дати.
Потім виводяться списки сторінок:
- на яких зник трафік;
- на яких зменшився трафік;
- на яких з'явився трафік;
- на яких збільшився трафік;
Зрозуміло, в звітах наводяться не тільки url, але і дані по візитах та% падіння / зростання.
Як це можна використовувати?
В першу чергу, це полегшує аналіз по сторінках, які втратили трафік . Крім того, при осіданні загальної відвідуваності, допомагає швидко визначити найбільш ймовірні причини. Наприклад, якщо бачимо, що велико число сторінок, на яких трафік повністю зник - копаємо в сторону налаштувань сайту і коректності індексації. Якщо ж великий провал у кількох важливих сторінок - то розбираємося з контентом і позиціями конкретних посадкових.
Нарешті, ви можете зробити аналог мого дослідження по Баден-Бадену - для конкретного потерпілого сайту. Чи отримуєте списки успішних і постраждалих сторінок після 22 березня і відправляєте їх окремо на аналіз в наступний інструмент, а потім порівнюєте середні показники в двох групах.
Пакетний аналіз тексту
Перевіряються параметри: слів за все, стоп-слів, унікальних словоформ, унікальних лем, классчіеская нудота, академічна нудота, варіативність, водність, ТОП-3 биграмм, ТОП-3 триграм, нудота биграмм, нудота триграм, індекс біграми / уніграмми, індекс триграми / уніграмми, відповідь сервера.
Є 3 режими роботи:
Важливо розуміти, що очищення контенту від «домішок» дуже непросте завдання. Plain-текст вдається виокремити не завжди (найчастіше «онучі» і немає на сторінці). У цьому випадку буде оброблятися весь текст. Для точного націлювання сервісу варто розмістити в коді коментарі-покажчики. Наприклад, у мене на блозі:
Надалі планую прикрутити настройки алгоритму визначення n-грам, ввести додаткові перевіряються параметри (продовжую вивчати відмінні характеристики переоптімізірованние текстів), зробити загальний індекс ймовірності визнання тексту спамние, отримання списку url з карти сайту і т.д.
Нагадую, що інструмент заточувався під статейні сайти. Повинен непогано підійти також для сайтів послуг, а от інтернет-магазини вимагають іншого підходу.
ps Обіцяну статтю про те, як на практиці використовувати сервіс для аналізу сайтів під текстовими санкціями напишу вже після SEMPRO, на наступному тижні. Поки нагадаю головне - ні в якому разі не можна покладатися на один параметр, розглядати всі «тошнотно» і індекси n-грам потрібно комплексно!
pps На згадане дослідження отримав масу відгуків. У тому числі повідомлення, що висновки підтверджуються на конкретних сайтах. Ось коментар:
Провели свій власний розрахунок «показника природності» на вашу алгоритму на статтях на одному з наших сайтів.
Цифри збіглися з вашими.
Різниця в «показники природності» між впали і не впали статтями якраз в середньому близько 10% і вийшла.
Тобто, ваша гіпотеза у нас підтверджується
А ось Олексій Сорокін пише про скромних результатах «расташніванія всіх статей на одному сайті» і про те, що висновки за підсумками збігаються з даними мого дослідження.
ppps Всім, хто давав сайти на аналіз Баден-Бадена, нарахована бонус 5000 лімітів. Пишіть мені e-mail реєстрації в сервісі, не соромтеся. Ще раз дякую!
Як це можна використовувати?