Большая задница SEO: ваш сайт слишком объемный, чтобы ползти с Screaming Frog?

  1. Как бороться с этими огромными сайтами?
  2. Использование PHPCrawl в качестве основы вашего ПО для сканирования больших задниц

Многие технические (SEO) онлайн-маркетологи знакомы с хорошей частью программного обеспечения под названием Кричащая лягушка , Функциональные возможности варьируются от проверки дубликатов страниц, заголовков и метаописаний до изучения технических проблем, связанных с состоянием заголовка HTTP, сумасшедшими конструкциями перенаправления и т. Д. Программа стоит всего 99GBP в год, что действительно дешево, учитывая тот факт, что большинство SEO-консультантов будут использовать его на ежедневно.

Однако есть одна большая проблема. Screaming Frog - это программа, которая работает в Windows локально. Это означает, что программное обеспечение зависит от границ вашего ПК или ноутбука. В процессе сканирования определенного веб-сайта Screaming Frog сохраняет определенные точки данных в вашей оперативной памяти. В зависимости от размера доступной памяти существует ограничение на количество страниц, файлов или URL-адресов, которые может обрабатывать программа. Каждый может легко попытаться определить пределы, начав сканировать такие сайты, как Amazon.com или Ebay.com. Эти сайты имеют миллионы уникальных страниц, и я могу заверить вас, что средний компьютер не зайдет так далеко в эти сайты. Это приведет к следующему сообщению:

Еще одна проблема с Screaming Frog заключается в том, что вы не можете сканировать несколько веб-сайтов одной командой. Это полезно, например, если вы хотите проанализировать сети ссылок. После того, как вы определили определенных участников в сети блогов, это сэкономит вам много времени, когда вы сможете ввести список с блогами и вернуть все внешние связанные веб-сайты.

Как бороться с этими огромными сайтами?

Поскольку я работаю на некоторых сайтах, превышающих средний по показателям проиндексированных страниц и посетителей / день, мне пришлось искать решение этой проблемы. Для этого есть несколько коммерческих решений, одним из которых является Deepcrawl в Великобритании , У них была та же проблема, что и у меня, и она сделала коммерческое решение. Проблема, с которой я сталкиваюсь с коммерческими решениями, заключается в том, что вы связаны ограничениями программного пакета, который вы покупаете.

Это заставило меня задуматься: «Как я могу создать масштабируемое решение для сканирования сайтов с более чем 1 000 000 URL-адресов?». Существует много доступных систем сканирования с открытым исходным кодом, из которых только некоторые действительно подходят для работы. В зависимости от языка, который вы можете программировать самостоятельно, вы можете взглянуть на следующие варианты:

Отказ от ответственности: имейте в виду тот факт, что вы можете быть заблокированы сервером или заблокировать веб-сайт, просматривая его слишком агрессивно.

Использование PHPCrawl в качестве основы вашего ПО для сканирования больших задниц

К сожалению, я могу кодировать только PHP и SQL, поэтому лучшим вариантом для меня была библиотека PHPCrawl. На самом деле это действительно полная система сканирования в Интернете, которую можно легко настроить в зависимости от ваших потребностей. Я знаю, что решения на основе языков программирования, таких как Java или C ++, больше подходят для выполнения задач быстрого сканирования, особенно из-за того, что вы можете ускорить процесс сканирования, запустив несколько экземпляров программного обеспечения и используя многоядерные процессоры. PHPCrawl может запускать несколько экземпляров из командной строки, но не каждый сервер подходит для этого. Вы должны проверить необходимые спецификации для этого на их веб-сайте.

Поэтому после того, как вы установили эту библиотеку на свой локальный или внешний сервер, вам нужно настроить базу данных для хранения информации. Я думаю, что самый простой способ сохранить ваши данные в базе данных MySQL. Я не буду вдаваться в подробности, потому что ожидаю, что люди, которые хотят работать с таким сканером, будут обладать достаточными навыками программирования, чтобы разрабатывать их в системе (базы данных внешнего и внутреннего интерфейса), исходя из своих потребностей.

Вы можете скачать небольшой пример PHP + MySQL (ZIP-файл), который можно использовать для сканирования определенного домена или массива доменов для всех внутренних и исходящих ссылок. Данные хранятся в базе данных MySQL. Я думаю, что это простой и понятный пример для начала.

Для больших сайтов системе потребуется время, чтобы получить все URL. Вы можете легко ускорить процесс, запустив несколько экземпляров. Для получения дополнительной информации о настройке PHPCrawl для ускорения процессов читайте инструкции на сайте , Если вы запускаете несколько экземпляров для ускорения процесса, помните о том, что серверы могут блокировать ваш IP-адрес из-за большого количества запросов в секунду, которые вы делаете. Чтобы избежать этого, вы можете встроить прокси-систему, чтобы каждый запрос проходил через случайный IP-адрес.

Вам необходимо убедиться, что вы используете кэширование базы данных вместо локальной памяти, иначе вы получите те же проблемы, что и с Screaming Frog. Оперативная память ограничена, базы данных - нет. PHPCrawl может кэшировать данные в базе данных SQLite. Просто добавьте одну строку кода в ваш скрипт: посетите веб-страницу PHPCrawl прочитайте инструкции ,

Базовая реализация PHPCrawl начинается с одного домена и сканирует каждый найденный URL. Вы также можете указать сканеру сканировать только определенный домен. Используя простой цикл, вы можете легко вставить массив доменов, чтобы он мог проверять и анализировать конкретные сети.

Если у вас есть какие-либо вопросы относительно настройки сканеров, не стесняйтесь отвечать на это сообщение в блоге. Любая помощь с обработкой данных? Просто напишите мне на [электронная почта защищена] , Я также хотел бы знать, как вы справляетесь со сканированием сайтов с более чем одним миллионом страниц, пожалуйста, поделитесь своим опытом в комментариях.

Похожие

SEO сборы
... сковой оптимизации - это метод повышения позиции сайта на первой странице Google, почему Google"> SEO или аббревиатура поисковой оптимизации - это метод повышения позиции сайта на первой странице Google, почему Google? Разве это не может быть в другом браузере? Можно, но этот SEO специалист по Google. Действительно, насколько важен SEO для бизнеса? Ну, мы дадим притчу, что это SEO сравнивается с продавцом, который, скорее всего, определяет количество проданных товаров.
Лос-Анджелес SEO Эксперт
Спасибо, что зашли на мой сайт. Вы пришли сюда, потому что вас беспокоит рейтинг вашей поисковой системы, вы хотите создать или обновить свой устаревший / несуществующий веб-сайт, или и то, и другое. Поисковая оптимизация (SEO) была основной частью моей работы последние шесть лет. Я также хорошо разбираюсь в веб-дизайне и графическом дизайне, но ушел на задний план из-за спроса на SEO. Наличие прочной основы веб-дизайна
SEO Сербия
У вас есть замечательный сайт , полный невероятно полезного контента для ваших потенциальных посетителей. Но таких посетителей нет. Они не могут найти вас через интернет-браузер. SEO (поисковая оптимизация) - это процесс, с помощью которого контент вашего сайта адаптируется к формату, который подходит для интернет-браузеров. спасибо SEO При этом ваш сайт будет иметь
Magento SEO
... вегетарианцев. Будучи типичным SEO-флекситом, ботаник любил заниматься этой задачей. Filetundco → OnPage SEO Magento Friseurzubehoer24 Ботаник на самом деле не тщеславен. Но я могу вам многое сказать: у него всегда красивые волосы!
SEO Терминология
Как SEO, я иногда выбрасываю сложную терминологию SEO в середине разговора с клиентом. Хотя я осознаю, что большинство людей не понимают этих терминов, мои иррациональные человеческие склонности заставляют меня иногда использовать их (без объяснения причин) в любом случае. К счастью, я довольно хорошо узнал озадаченное выражение их лиц, остановился и определил термин, который я только что использовал, или провел какую-то аналогию. Другими словами, я довольно прилично объяснил SEO таким способом,
Википедия как инструмент SEO
... снили теории, чтобы улучшить позиционирование в поисковых системах"> Много раз мы говорили о SEO ; мы определили это, и мы объяснили теории, чтобы улучшить позиционирование в поисковых системах. Мы уже знаем, что аббревиатура «SEO» означает поисковую оптимизацию, и мы можем различать SEO на странице и SEO вне страницы. Последнее основано на создании качественного контента, который, в соответствии
Ваш сайт оптимизирован: SEO вне страницы
Что такое SEO вне страницы? Вы можете видеть вне страницы SEO как размещение указателей на вашем сайте. Самым известным примером этих указателей являются ссылки. Если чужая страница ссылается на вашу собственную страницу, это повышает авторитет вашего поля в Google. Это способствует доверию и авторитету вашего сайта. В дополнение к SEO вне страницы, также есть SEO
Как оценить эффективность SEO
2016-10-22 | 3375 Распечатать PDF SEO предназначено для вас? Серьезно ли, поисковая оптимизация - верный путь для вашего бизнеса? ... Если вы не терпеливы или настойчивы, то я думаю, что SEO может не подойти. Есть много
Как правильно оптимизировать ваш одностраничный сайт?
... веб-сайт, также называемый прокручивающимся веб-сайтом Parallax, стал горячей и увлекательной тенденцией веб-дизайна в 2016 году. Сайт состоит из длинной единой страницы для посетителей, где все содержимое существует. Когда вы нажимаете на навигацию по сайту, вы переходите в другой раздел страницы, тогда как в традиционной архитектуре сайта нажатие на панель навигации привело бы к переходу на другую страницу. Они отлично подходят для привлечения мобильных пользователей,
Оттава SEO
SEO услуги
... сего, давайте определимся с концепцией SEO. SEO (поисковая оптимизация) или поисковая оптимизация - это все методы, применяемые к веб-сайту, который стремится улучшить его видимость в Интернете. SEO рождается в необходимости выделяться среди других сайтов конкурентов, это означает, что в результатах поиска в Google (или других поисковых системах) сайт является одним из первых результатов. Теперь, почему мы бежим, чтобы быть на первых местах? Потому что интернет-тренды

Комментарии

Вы хотите, чтобы ваш сайт можно было найти в результатах поиска в поисковых системах, таких как Google или Yahoo?
Вы хотите, чтобы ваш сайт можно было найти в результатах поиска в поисковых системах, таких как Google или Yahoo? Тогда вы можете SEO Я уверен, что вы поможете. Yellowshape предоставляет несколько полезных советов по поисковой оптимизации ниже. Определите соответствующие ключевые слова Ваши потенциальные
У вас есть еще вопросы о SEO или вы хотите знать, как работает ваш сайт?
У вас есть еще вопросы о SEO или вы хотите знать, как работает ваш сайт? принимать свяжитесь с нами для совета или возможностей оптимизации вашего собственного сайта.
Что вы можете сделать, чтобы гарантировать, что ваш сайт удовлетворит запрос пользователя как можно лучше?
Что вы можете сделать, чтобы гарантировать, что ваш сайт удовлетворит запрос пользователя как можно лучше? С использованием метатегов. Они помогают гарантировать, что пользователи, ищущие информацию, должны знать о вашем сайте, отображаются в краткой, полезной форме. Некоторые типы метатегов относятся к структуре страницы и навигации, в то время как другие сообщают поисковым системам, какие части вашей страницы более важны. Тег заголовка и мета-описание являются наиболее важными:
Как расширение вашего домена и локальный хостинг влияют на ваш рейтинг в SEO?
Как расширение вашего домена и локальный хостинг влияют на ваш рейтинг в SEO? Google использует расширение домена вашего сайта, чтобы понять географические настройки вашего сайта. Это означает, что если ваш бизнес ориентирован на Великобританию, вам следует использовать расширение
Являются ли они точными и что вы можете сделать, чтобы повлиять на них, чтобы ваш сайт получил более высокую оценку?
Являются ли они точными и что вы можете сделать, чтобы повлиять на них, чтобы ваш сайт получил более высокую оценку? Давайте разберемся. Начиная с Бога поиска, то есть Google, PankRank был впервые разработан основателями Ларри Пейдж и Сергей Брин , Чтобы выразить это в самых основных терминах, PageRank (иначе известный как PR) просматривает ссылки, чтобы определить, насколько полезен
И что еще более важно, если Google не справляется с этим в одиночку, как мне действовать в качестве оператора веб-сайта, чтобы лучше позиционировать свой сайт?
И что еще более важно, если Google не справляется с этим в одиночку, как мне действовать в качестве оператора веб-сайта, чтобы лучше позиционировать свой сайт? SEO для маленьких страниц: все, что вам нужно, это доверие! Как упоминалось во введении, доверие, которое Google оказывает сайту, представляет собой фиксированный набор факторов ранжирования. К сожалению, доверие также является одним из самых труднодоступных факторов ранжирования, потому что в отличие от таких показателей,
Если вы думаете о найме поставщика услуг Tampa SEO для оптимизации вашего веб-сайта, у вас может возникнуть множество вопросов, таких как «Что на самом деле включает в себя SEO?
Если вы думаете о найме поставщика услуг Tampa SEO для оптимизации вашего веб-сайта, у вас может возникнуть множество вопросов, таких как «Что на самом деле включает в себя SEO?». Именно это мы и рассмотрим. Что участвует в SEO? Владельцы бизнеса в Тампе часто задаются вопросом о том, какие изменения потребуются для улучшения поисковой оптимизации их веб-сайта. SEO - это очень многогранная дисциплина, которая затрагивает множество различных областей сайта,
Как насчет того, чтобы время от времени включать галерею изображений с фотографиями вашего последнего проекта кровли?
Как насчет того, чтобы время от времени включать галерею изображений с фотографиями вашего последнего проекта кровли? И не стесняйтесь шпионить за конкурентами и узнавать, что они делают. График контента помогает вам быть впереди вещей. Вам не обязательно платить за модный инструмент здесь. Google Docs или Excel, скорее всего, предоставят все необходимые вам функции. Или, если ваш сайт работает на WordPress, как насчет использования популярного
Хотите, чтобы ваш контент переводился дословно или, в идеале, вы хотите, чтобы он был адаптирован к местному контексту?
Хотите, чтобы ваш контент переводился дословно или, в идеале, вы хотите, чтобы он был адаптирован к местному контексту? Локализованный текст всегда будет приносить вам большую рентабельность, поскольку укрепляет доверие потребителей. Во-вторых, вам понадобится эксперт по SEO, чтобы сделать ваше локализованное предложение привлекательным как для посетителей, так и для поисковых систем. Следующая статья содержит полезную информацию по этому вопросу:
Вот как работает настоящий сценарий, как насчет будущего SEO?
Вот как работает настоящий сценарий, как насчет будущего SEO? Что дальше? Будущая сфера SEO: факторы ранжирования Пользовательский опыт будет главным приоритетом Все алгоритмы Google направлены на улучшение взаимодействия с пользователем. Если вы любите своих пользователей,
Так как же ваш сайт может сделать то же самое?
Так как же ваш сайт может сделать то же самое? Читайте дальше, как я покажу вам лучшие стратегии SEO для повышения конверсии! Вот пять лучших стратегий, которые вы можете начать делать сегодня для лучшего сайта: Использование динамического контента Если вам интересно, что такое динамический контент, это контент, отображаемый на вашем сайте, который может измениться в любое время, в зависимости от того, кто посетитель. Обычно это может

Как бороться с этими огромными сайтами?
Как бороться с этими огромными сайтами?
Это заставило меня задуматься: «Как я могу создать масштабируемое решение для сканирования сайтов с более чем 1 000 000 URL-адресов?
Любая помощь с обработкой данных?
Разве это не может быть в другом браузере?
Действительно, насколько важен SEO для бизнеса?
Серьезно ли, поисковая оптимизация - верный путь для вашего бизнеса?
Теперь, почему мы бежим, чтобы быть на первых местах?
Вы хотите, чтобы ваш сайт можно было найти в результатах поиска в поисковых системах, таких как Google или Yahoo?

© Частный пансионат "Фортуна"  2013
Разработка сайта:   WEB-студия “KPORT”
При создании сайта использованы фото проекта peschanoe.net