Category: технологии

Category was added automatically. Read all entries about "технологии".

Я, не робот

Если на сайте нет приличного фильтра товаров, его можно изобрести самому.

Например, на Амазоне в разделе "Игрушки" нельзя отсортировать список по количеству отзывов. Параметр нужно подсмотреть в другом разделе (например, книги) и самому подставить в адресную строку &sort=review-count-rank.

На goodreads.com с фильтрами вообще плохо. Например, нельзя получить хоть тот же список книг по определенному тегу с наибольшим количеством отзывов.

Тогда можно пойти в Гугль с примерно таким запросом: "childrens" "10000.. ratings" site:goodreads.com/book/show/. "10000.. ratings" — это такая отличная фича Гугля, его можно просить найти любое число в заданном диапазоне. "10000.." — любое число больше 10 тысяч. 25..50 — в интервале от 25 до 50 и т.п.

В адресной строке еще нужно вручную приписать &filter=0 (чтобы Гугль показал все результаты, включая "похожие" друг на друга — а то мало ли что ему похожим покажется). И теперь можно брать список с Гугля. Разумеется, нужно, чтобы все результаты поместились в выдачу, поэтому, если результатов предполагается больше пятисот, имеет смысл поделить интервал на несколько меньших.

Правда вот, поскольку поисковый ваш паттерн станет отличаться от привычного для Гугля, вскоре вам покажут "экран смерти".


Ровно так — просто картинку. Тогда нужно вернуться на предыдущую страницу и снова повторить запрос. Тогда уже потребуют ввести каптчу. "Sometimes you may see this page if you are using advanced terms that robots are known to use" — вот это про вас.


Доказали, что не робот? Продолжайте листать страницы. Через некоторое время покажут еще каптчу. Потом, кажется, еще одну...

А потом вас забанят в Гугле. "Our systems have detected unusual traffic from your computer network. Please try your request again later". Страница счастья - http://www.google.com/sorry/misc/
Никакой каптчи. Бан. Про "The block will expire shortly after those requests stop" — врут, даже если выключить компьютер на 12 часов, при повторе запроса — страница счастья.

Впрочем, не переживайте, бан ненастоящий, Гугль будет работать как обычно. Вам не позволят только делать запросы, похожие на исходный — например, можно продолжать искать то же слово по тому же сайту, а вот с диапазоном уже нельзя.

Переход на google.ru вместо google.com ожидаемо не помогает. Замена site на inurl не помогает. Замена интервала "1000..2000" на "1000.." -"2001.." (показать всё больше 1000, при этом исключить все больше 2001) — ого, помогает, можно листать дальше.

С этим (пока) не забанили, так что продолжение следует.

Амазон в России

"Крупнейший в мире интернет-магазин Amazon.com приходит в Россию. Если раньше покупателям были доступны только книги, видео и аудио продукты, теперь же можно будет заказывать и все остальное." (первый попавшийся источник, легко еще десяток таких можно наскрести)

Размечтались, ага.

Давайте еще раз почитаем исходную новость.

"сообщили несколько источников на издательском рынке"
"занимал пост генерального директора издательской группы"
"по категориям хранение и доставка товаров, упаковка товаров для последующей транспортировки, электронное хранение текстов, аудиовизуальных произведений, файлов"
Ну и из другой новости: "Компания Amazon анонсировала выход своего Appstore на рынок еще 200 стран, в числе которые есть не только Папуа Новая Гвинея и Ватикан, но и Россия".

То есть компания нанимает издателя, контактирует только с издателями и подает заявку на "электронное хранение текстов и книг" и хранение и доставку товаров (ммм, дайте угадать, Kindle?).

Все, что собирается сделать Амазон - это организовать в России официальную продажу планшета Kindle Fire с приложениями под Андроид и читалки Kindle с электронными книгами (ЛитРесу на выход).
Вся большая розница, дешевая одежда и электроника из-за рубежа (ага, размечтались) и даже печатные книги - фантазии журналистов и "экспертов".

Справедливости ради, перечень товаров и услуг в заявке в Роспатент длиннее, но, за вычетом "транспортировки товаров в охлажденном состоянии", все это укладывается в концепцию "Kindle с книгами и приложениями".

Чтобы завершить гештальт: "Amazon ищет специалистов по продаже Kindle-контента на рынке России" (источник). Соответственно, результат поиска слова "russia" в вакансиях Амазона.

И аналоги уже есть - в Бразилии Амазон продает только электронные книги. Стало быть, и "русский Амазон" будет выглядеть примерно так - http://www.amazon.com.br/

Ребятам о вордстате. Недокументированном

Про wordstat.yandex.ru. Те пятеро из вас, кто знает, что это такое, - читают и радуются (будет то, чего вы не знали), остальные лучше проскролливайте.

Дата обновления

Сейчас на страницах статистики по словам написано "Обновлено: 21/01/2011". Вопрос, за какой период приведены данные? Если вы решили, что за "21.12.2010—20.01.2011" (плюс-минус день) - то это неверный ответ. В действительности, статистика приводится с опозданием на неделю.

Убедиться в этом легко - достаточно посмотреть даты популярных новостей. Например, 18 января 2011 г. было объявлено о назначении Гуллита главным тренером Терека, но вот обновленный 21 января Вордстат об этом еще не знает.

Немного о том, как ищут пользователи

Статистика запроса "в" немного расскажет нам о поведении пользователей. По вордстату, его набирают 1,5 млн раза в месяц - в 10 раз чаще, чем какие-нибудь "а", "с" и "и".

Понять истоки этот феномена поможет здравый смысл и главная страница Яндекса. Как известно, Яндекс предлагает поисковые подсказки - по-видимости, многие школьники видят всевоможные "в контакте", "вконтакте", "в контакте добро пожаловать", "в контакте вход моя страница" - и, не утруждая себя выбором одной из них, сразу жмут "Ввод" или кнопку "Найти". По счастью, сайт vkonktakte.ru на первом месте в выдаче по запросу "в", так что поисковый шаблон только закрепляется.

Создателям сайтов-обманок на заметку. Запросы "о" и "од" по аналогичным причинам также весьма популярны - при этом в первой десятке по этим запросам сайта odnoklassniki.ru нет, так что Яндекс давно ждет желающих сделать фальшивый сайт Одноклассников, продвинуть его по запросу "о" в топ и собирать до полумиллиона показов в месяц (при желании - и базу логинов с паролями).

В декабре Яндекс показал страницу результатов 3 226 264 143 раза

Еще Яндекс в вордстате показывает, сколько всего, по всем запросам, было показов страниц выдачи за выбранный период. Достаточно лишь посмотреть в вордстате статистику запроса, например, "яндекс" по месяцам, навести курсор на нужную точку и посмотреть число, которое Яндекс указывает с абсолютной точностью.
В декабре 2010 г. на абсолютной шкале: 6193948 показов, на относительной шкале: 0,00191985148315861.
Несложные расчеты - и получаем, что общее число показов страниц выдачи в декабре составило ровно 3 226 264 143 показа.
В январе 2009 г., для сравнения, 1 470 763 753 - желающие могут дружно проследить за ростом Яндекса за последние два года.

Только нужно быть внимательным и не брать низкочастотные запросы, поскольку у Яндекса на этой странице баг, и начиная с определенного момента он ошибается на порядок - вместо пяти нулей после запятой рисует шесть (в этом можно убедиться, посмотрев, например, статистику запроса "океания").

Сезонные запросы

Вообще, на статистику запросов по месяцам бывает полезно взглянуть. Любые небольшие сезонные колебания - повод для внимательного изучения. Тогда, если ваш клиент вздумал рекламироваться по запросу "спид" - вы заранее, до наступления 1 декабря сможете добавить стоп-слова "день борьбы"; а для рекламы мешков - добавить стоп-слово "осень" до того, как школьники начнут писать сочинение по картине Мешкова "Золотая осень".

Кому нужен inurl?

Помнится, поисковые операторы link и anchor выпилили под предлогом, что они "задаются, в основном, не людьми, а роботами".
Теперь любой желающий вправе посмотреть на статистику по словам для запроса inurl (сплошные гостевые и форумы), на статистику по регионам (98,5% приходится на американского робота), на статистику по месяцам (активность роботов достигает почти двух миллионов показов страниц в месяц) и порекомендовать Яндексу "или крестик снять, или трусы надеть".

Баден-Баден и его роль в подборе запросов

Из хелпа: "Повторяющиеся слова в ключевом словосочетании объединяются. Например, вместо «Баден-Баден» в форме запроса останется только слово «Баден»".

Яндекс забыл уточнить (скорее всего, и сами не знают) одну полезную особенность. Дело в том, что вместо слов "баден баден" в кавычках Яндекс покажет не количество запросов "баден", а количество двухсловных запросов, содержащих слово "баден". И далее - "баден баден баден" - количество трехсловных запросов, и т.д.

Соответственно, для любого запроса можно построить табличку с распределением количества слов.
Например, для запросов, содержащих слова "!мягкая" и "!мебель":
СловПоказов
217920
340916
443730
518826
68529
73210
81371
9614
10271
11130
1268
...193
Все135778
Так что можно узнать, что 96% запросов со словами "мягкая" и "мебель" приходится на запросы из шести и менее слов.