Блог. Создать и раскрутить



бет8/11
Дата15.11.2016
өлшемі1,59 Mb.
#1773
1   2   3   4   5   6   7   8   9   10   11

Числоформы (этот термин введен Денисом Фурсовым).


Для того чтобы при запросе какого-либо нужного номера (например, номера приказа или номера телефона) в выдаче вам не попадались посторонние ИНН, маркировки радиоламп и микросхем, а также прочие лишние результаты, рекомендуется перед номером, который вы ищете, поставить восклицательный знак или взять этот номер в кавычки.
Сами номера надо написать во всех возможных вариантах, разделив их оператором «ИЛИ» и объединив в круглую скобку.
Запросы [(тел | телефон) (!123-45-67 | !1234567)]и [(тел | телефон) ( 123-45-67” | 1234567”)]дадут одинаковые результаты. В выдаче Телефонные анекдоты, смешные разговоры по телефону.
У меня такая запись на автоответчике (допустим ваш номер телефона 123- 45- 67) «Вы позвонили по телефону 123- 45- 67».
Поиск на определенном сайте.Оператор имеет вид url=www.url.ru/cat*.Хотим обратить внимание читателя на то, что на сайте Яндекса этот оператор имеет вид url=www.URL.ru/cat/*с косой чертой в конце. Наш опыт показывает, что эта косая черта часто ухудшает результаты выдачи, поэтому мы рекомендуем записывать оператор без нее – url=www.URL.ru/cat*.Обратите внимание на «звездочку» в конце адреса. Это символ маски, который означает, что нас устраивает любая страница сайта, адрес которой начинается так, как написано слева от «звездочки».
Чтобы воспользоваться оператором, позволяющим проводить поиск на определенном сайте, лучше скопировать его целиком из таблицы на сайте Яндекса в разделе «Язык запросов», а затем заменить в нем адрес на нужный пользователю, нежели вводить вручную. Так можно свести к минимуму риск орфографической ошибки.
Операторы поиска на определенном сайте можно сгруппировать так, чтобы поиск проводился на группе сайтов. Денис Фурсов приводит пример поиска слова «работа» на сайтах www.ko.byи www.superjob.ru, который дает в общей сложности почти 800 страниц.


ПРИМЕР


Запрос [работа && (URL =”www.ko.by*” | URL =”www.superjob.ru*”)]
Результат поиска страниц – 39 299, сайтов – не менее 2, в каталоге – 2.
В выдаче Кадровое агентство Коллекция Открытий … кадры, работав Минске, работав…
В/о, опыт работыот двух лет, ответственность за организацию работна строительном участке, контроль качества, объема, сроков выполнения работ…
В/о или средне-специальное (желательно ПГС). Опыт работыот года, организация работна строительном участке, контроль качества, объема, сроков…
www.ko.by/vacancy.php?typework=all 163 КБ и Работадолжна доставлять удовольствие! Социологические опросы « Работаради работы– это извращение»;
«Другое дело – получать удовлетворение от хорошо выполненной работы»; «…если работаначала доставлять удовольствие, значит, пора разводиться».
www.superjob.ru/research/articles/478/ 66 КБ

Оператор ссылки (link).Он показывает, какие внешние сайты содержат ссылку на сайт, указанный в запросе. Это один из самых важных для конкурентной разведки операторов, поскольку позволяет найти друзей или союзников конкурента, часто ведет на личные странички бывших или действующих сотрудников компаний, может привести к размещенным сотрудниками объявлениям о поиске работы или, например, выявить аффилированные структуры.


Записывается оператор следующим образом
link=”www.url.ru/cat/*”
Как и в предыдущем случае, мы рекомендуем убирать последнюю косую черту, после которой указан символ «звездочка». Если надо найти ключевое слово в ссылающихся страницах, то оператор linkсочетается с обычными ключевыми словами, отделяясь от них двойным амперсандом.
Например, зададим поиск слова «креатив» в сайтах, ссылающихся на сайт издательства «Вершина» www.vershinabooks.ru


ПРИМЕР


Запрос [креатив && link=”www.vershinabooks.ru*”] Результат поиска страниц – 48, сайтов – не менее 10. В выдаче Издательство деловой литературы «Вершина».
Зарегистрироваться
Креативкак бизнес и бизнес как креатив.
www.vershinabooks.ru/books/book435.html · 14 КБ

ВНИМАНИЕ!Оператор link показывает ссылки на сайт так, как он указан в тексте ссылки. В настоящее время стало стандартом де-факто, что сайты одинаково открываются, как при вводе адреса с «www», так и без «www». Запрос, приведенный выше (с «www») покажет только те ссылки, где «www» присутствует в тексте ссылки и не покажет те ссылки, где его в тексте ссылки нет. Поэтому имеет смысл делать также запрос [креатив && link=”vershinabooks.ru*”]. Результат поиска страниц – 1211, сайтов – не менее 74.


При этом можно еще раз проиллюстрировать влияние знака «плюс» на результат выдачи в Яндексе.


ПРИМЕР


Запрос [+креатив && link=”vershinabooks.ru*”]
Результат поиска страниц – 31, сайтов – не менее 9.

Остальные страницы, показанные в предыдущем запросе, ссылались на сайт издательства «Вершина», но слова «креатив» не содержали.


Оператор поиска в заголовке страницы.Для тех, кто не занимается сайтами профессионально, напомним, что заголовок страницы – это то, что написано на синем (для Windows XP) поле в самом верху экрана, как бы уже за пределами страницы, на ее рамке. А с точки зрения разметки HTML, эта часть сайта заключена внутри тега «TITLE».
Яндекс справедливо считает, что если ключевое слово содержится в самом заголовке страницы, значит, эта страница точно имеет непосредственное отношение к запросу.
Каким образом выглядит синтаксис оператора, покажем на примере поиска слова «разведка» на страницах, содержащих в заголовке словосочетание «ИПК УГТУ».


ПРИМЕР


Запрос [+разведка && $title (маркетинг)]
Результат поиска страниц – 10 800, сайтов – не менее 1136.
В выдаче Книга «Конкурентная разведка маркетинг…
Презентация книги «Конкурентная разведка маркетинг рисков и возможностей» на «Галерее продаж» в Москве 2 декабря 2005 года. Читатель узнает, где и как взять информацию, какие технические средства использовать, куда «влить» свою службу разведкии как обнаружить разведку…
ci-razvedka.narod.ru/Kniga.html 9 КБ

Остальные операторы языка запросов Яндекса представляют меньший практический интерес, хотя и значительно разнообразят возможности поиска. Ознакомиться с ними можно на странице помощи в Яндексе [23], пройдя по ссылкам «Помощь – Как искать – Язык запросов».


[b]Поиск в Гугле[/b]

Гугл становится все более популярным. За ним стоит колоссальный финансовый ресурс, которым грамотно распоряжаются. Так, по словам инженера по программному обеспечению Гугла Мэта Катса, уже в 2002 году каждые 28 дней эта поисковая система индексировала 3 миллиарда веб-документов, в том числе более 3 миллионов новых страниц каждый день.
Гугл в чем-то проигрывает Яндексу, а в чем-то выигрывает у него. Поскольку об операторах Яндекса читатель уже знает, то для удобства при рассказе об операторах Гугла будем в ряде случаев проводить их сравнение.
Основы поиска.Чтобы ввести запрос, напечатайте ключевые слова и нажмите Enterлибо щелкните кнопку «Поиск в Google».
Гугл использует интеллектуальную технику анализа текстов, которая позволяет искать важные и вместе с тем релевантные страницы по вашему запросу. Для этого он анализирует не только ту страницу, которая соответствует запросу, но и те, что на нее ссылаются, чтобы определить ценность этой страницы для целей вашего запроса. Кроме того, Гугл предпочитает страницы, на которых ключевые слова, введенные вами, расположены недалеко друг от друга.
Показ ключевых слов в результатах.Первый способ увидеть ключевые слова заключается в том, что каждый раз в списке найденных страниц Гугл показывает отрывок из текста на странице, выделяя в этом отрывке ключевые слова. Тем самым облегчается обнаружение ключевых слов в тексте. Второй способ – загрузить страницу по ссылке «Сохранено в кэше». Недостаток этого способа (конкурентная разведка нередко это рассматривает как преимущество) – в том, что вы видите не ту страницу, которая есть сегодня, а ту, которая сохранена в базе Гугла. Изначально эта опция была придумана для того, чтобы сохранить возможность просмотра страницы даже в тех случаях, когда сервер, на котором эта страница расположена, недоступен.
Третий способ – традиционный для просмотра текста в браузере – использовать сочетание клавиш CTRL+F. Появится окно «Найти», в которое вводятся искомые слова. Раскладка клавиатуры, установленная в этот момент на компьютере, значения не имеет.
Логическое «И».В отличие от Яндекса, в Гугле всего одно логическое «И», оно наиболее близко к оператору Яндекса &&в сочетании с оператором «плюс», поставленным перед каждым словом запроса. Это логическое «И» позволяет выдавать документы, которые принудительно содержат ключевые слова в любом месте текста. По умолчанию при написании слов запроса через пробел Гугл ищет документы, содержащие все слова запроса.


ПРИМЕР


Запрос [литейщик провизор стоматолог маркшейдер]
Результат поиска 1–10 из примерно 37 для литейщик провизор стоматолог маркшейдер.
В выдаче Общероссийский классификатор занятий ОК 010-93 (ОКЗ) (утв…
Примеры профессий, входящих в данную базовую группу ФармацевтПровизор Базовая… Вальцовщик гидроизоляционных материа ловЛитейщик облицовочных плиток… www.magister.msk.ru/library/economic/work/ok010.txt – 952k -
Поиск вакансии
ВРАЧ-РЕНТГЕНОЛОГ, ВРАЧ-СТОМАТОЛОГ, ВРАЧ-СТОМАТОЛОГ-ХИРУРГ, ВРАЧ-ТЕРАПЕВТ… НА МАШИНАХ ДЛЯ ЛИТЬЯ ПОД ДАВЛЕН, ЛИТЕЙЩИК САНИТАРНО-СТРОИТЕЛЬНЫХ ИЗДЕЛИЙ…
d37.chtts.ru/vac/edrd.asp – 63k

Интересно, что Гугл может показать и те страницы, на кoтopыx нет ключевых слов, но эти слова содержатся в ссылках на показанную страницу. В таком случае при просмотре страницы с помощью ссылки «Сохранено в кэше» будет видна надпись «Эти слова присутствуют только в ссылках на эту страницу».


Логическое «ИЛИ».Пишется с помощью оператора OR, либо, как и в Яндексе, с помощью символа вертикальной черты | Обратите внимание, что оператор ORдолжен быть написан заглавными буквами и отделен пробелами с обеих сторон от слов, расположенных перед ним и после него.
Важно знать, что, в отличие от Яндекса, Гугл не поддерживает такой оператор, как скобки.


ПРИМЕР


Запрос [литейщик OR провизор OR стоматолог OR маркшейдер], либо [литейщик | провизор | стоматолог | маркшейдер]
Результат поиска 1–10 примерно из 2 330 000 для литейщик| провизор| стоматолог| маркшейдерлибо
1–10 примерно из 2 330 000 для литейщик OR провизор OR стоматолог OR маркшейдер.

Заглавные буквы или прописные?Гугл, в отличие от Яндекса, не чувствителен к регистру. Все буквы воспринимаются как прописные, вне зависимости от того, как их вводили в поисковую строку. Запросы [Эйфелева Башня], [Эйфелева башня] и [эйфелева башня] дадут одинаковые результаты.



ПРИМЕР (результат на момент написания книги)


Результат поиска 1–10 примерно из 511 000 для Эйфелева Башня.
Результат поиска 1–10 примерно из 511 000 для эйфелева башня.

Стоп-слова.В хэлпах (так часто называют раздел «Помощь» в онлайновых сервисах) написано, что Гугл, подобно большинству поисковых машин, игнорирует стоп-слова. Кроме того, хэлпы говорят о том, что, как и многие другие поисковые машины, Гугл имеет механизм принудительного включения стоп-слов в результаты поиска. К стоп-словам относятся большинство артиклей английского языка, а также союзов и предлогов русского языка. В реальности ситуация, похоже, изменилась.



ПРИМЕР


Запрос 1 [в]
Результат поиска 1–10 примерно из 619 000 000 для в.
Запрос 2 [the]
Результат поиска 1–10 из примерно 5 620 000 000 для the.

Оператор «плюс» (+).Тем не менее бывают ситуации, когда надо принудительно включить в текст какое-либо слово, которое может иметь варианты написания. В хэлпе Гугла приводится пример с запросом «Star Wars Episode I», где римская единица представляет собой латинскую букву I(Ай).



ПРИМЕР


Запрос 1 [Star Wars Episode I]
Результат поиска 1–10 примерно из 3 150 000 для Star Wars Episode I.
В том числе в выдаче появятся слова «Episode II», «Episode IV» и т. п.
Запрос 2 [Star Wars Episode +I]
Результат поиска 1–10 примерно из 2 810 000 для Star Wars Episode +I.

И в него войдут только тексты, содержащие слово «Episode I».


Морфология слов.Гугл официально подтвердил, что поддерживает морфологию русского языка. Правда, делает он это не так, как многие другие поисковые машины. С одной стороны, алгоритм поддержки русского языка Гуглом дает возможность видеть не только словоформы, но и другие части речи, а с другой стороны, не все словоформы редких слов поддерживаются на практике. О плюсах этого алгоритма сотрудник Гугла Александр Грушецкий на официальном блоге заявил следующее.


?Сейчас… мы умеем обращаться с морфологией и знаем другие особенности русского. Поэтому когда это нужно, мы ищем не только слова из вашего запроса, но и их различные формы. Реализовать морфологию было довольно просто, но традиционные подходы имеют множество недостатков. Мы же выбираем алгоритмы, которые в первую очередь улучшают качество результатов реальных пользовательских запросов и избавляют вас как от необходимости набирать различные варианты одного запроса, так и от просмотра множества не интересующих вас страниц. Мы постоянно изменяем и совершенствуем наши алгоритмы и пополняем арсенал трюков по обработке слов. Например, традиционная реализация русской морфологии не поддерживает множество других полезных преобразований слов. Теперь же, например, для запроса как лечить ожогбудут также найдены страницы, содержащие лечение ожогов,для звон колокола – колокольный звон,для футбол английский чемпионат – чемпионат Англии по футболу,а для русификация ICQ – русификатор ICQ.
Также чрезмерное увлечение морфологией чаще вредит, чем помогает. Поэтому мы стараемся использовать словоформы там и тогда, где это действительно нужно, и делать это как можно аккуратнее. Например, «готов к войне» не имеет отношения к запросу «война с готами», ответом на вопрос кто такие татыбудет явно не тату,а для запроса мыть кошкубольше подойдет мытье кошек,чем моя кошка.Кстати, вы всегда можете полностью отключить использование форм слова, поставив оператор «+» перед словом или взяв его в кавычки. Например, для запроса звон + колоколаили звон «колокола»,будет найдено только точное вхождение слова колокола,а вот колокольный звоннайден не будет.
Но на самом деле вам не нужно знать все эти тонкости. Вам просто нужно искать, как вы обычно это делаете, а мы найдем то, что вам нужно.

Ограничение возможностей работы Гугла со словоформами редких слов видно на примере словосочетания «глоклая куздра» [24].



ПРИМЕР


Запрос 1 [глоклая куздра]
Результат поиска 1–10 примерно из 50 для глоклая куздра.
Запрос 2 [глоклую куздру]
Результат поиска 1–3 из 3 для глоклую куздру.
Запрос 3 [глоклой куздре]
Результат поиска 1–6 из 6 для глоклой куздре.

Просто для сравнения приведем результат Яндекса. По всем трем запросам о глоклой куздре Яндекс давал на момент написания книги одинаковый результат.


Результат поиска страниц – 52, сайтов – не менее 22.
Мы рекомендуем в ответственных случаях вводить важные слова в разных словоформах вручную, чтобы избежать ошибок.
Ниже будут показаны случаи, когда даже по общеупотребительным словам Гугл словоформы обрабатывает не вполне корректно.


ПРИМЕР


Запрос 1 [журавль]
Результат поиска 1–10 примерно из 656 000 для журавль.
В выдаче ЖУРАВЛЬСЕРЫЙ
ЖУРАВЛЬСЕРЫЙ (Grus grus) это как раз тот самый журавль, чьи звонкие крики мы сльшим высоко в небе весной и осенью. Это крупная птица ростом около 125 см и… www.floranimal.ru/pages/animal/zh/1325.html– 22k.
Запрос 2 [журавль -журавль]
Результат 1–10 из примерно 322 000 для журавль –журавль.
В выдаче Гамзатов, Расул.
ЖУРАВЛИМне кажется порою, что солдаты, С кровавых не пришедшие полей… Сегодня, предвечернею порою, Я вижу, как в тумане журавлиЛетят своим… www.litera.ru/stixiya/authors/gamzatov/mne-kazhetsya-poroyu.html – 6k.

Улучшение запроса во время поиска.По мере того как вы проводите поиск, в найденных текстах обнаруживаются слова, которые вы упустили из виду, создавая запрос. В ряде случаев результаты станут точнее, если по этим словам проводить поиск дополнительно, составляя отдельные запросы. Подчеркнем особо – это должны быть именно отдельные запросы. Если же добавлять эти слова к уже имеющемуся запросу, то можно иногда излишне сузить диапазон результатов – ведь Гугл будет пытаться выдать документ, в котором содержатся всеслова запроса.


Исключение слов из запроса. Логическое «НЕ». Как известно, при составлении запроса часто встречается информационный мусор. Чтобы его удалить, стандартно используются операторы исключения – логическое «НЕ». В Гугле такой оператор представлен знаком «минус» – идентичным оператору Яндекса «двойная тильда» (~~). Используя этот оператор, можно исключать из результатов поиска те страницы, которые содержат в тексте определенные слова.


ПРИМЕР


Запрос 1 [Журавль колодец]
Результат поиска1–10 из примерно 91 200 для Журавль колодец.
Запрос 2 [ Журавль колодец -птица ]
Результат поиска 1–10 из примерно 40 400 для Журавль колодец-птица. Запрос 3 [Журавль колодец -птица]
Результат 1–10 из примерно 508 000 для Журавль -колодец -птица.

Кстати, в этом запросе также проявилось, на наш взгляд, несовершенство поддержки морфологии русского языка Гуглом. Так, в момент написания книги в выдаче присутствовал текст, содержащий слово «птицы» СЕМЕЙСТВО ЖУРАВЛИ.



ПРИМЕР


Семейство ЖУРАВЛИ(Gruidae). К семейству журавлиных относятся крупные длинноногие птицы с длинной шеей и прямым копьевидным клювом…
www.floranimal.ru/families/4295.html– 16k.
Запрос 3 [Журавль -колодец -птица -птицы]
Результат поиска 1–10 примерно из 450 000 для Журавль -колодец -птица -птицы.
И в результатах по этому запросу документа со словом «птицы», приведенного выше, не оказалось.
Запрос 4 [Журавль -колодец -птица -птицы -журавли]
Результат поиска 1–10 примерно из 432 000 для Журавль -колодец -птица -птицы -журавли.

Поиск точной фразы.Точная фраза на практике, как мы уже говорили, требуется либо при поиске текста определенного произведения, либо при поиске определенных продуктов или компаний, в которых название или часть описания представляет собой стабильно повторяющееся словосочетание.


Чтобы справиться с поиском точной фразы при помощи Гугла, требуется заключить запрос в двойные кавычки.


ПРИМЕР


Забавным, но показательным примером может быть задание из учебника русского языка для седьмого класса под редакцией Н. М. Шанского. На странице 45 приведено задание разделить текст на абзацы. Фрагмент взят из произведения М. Шолохова (название не указано)
«За Доном в лесу прижилась тихая, ласковая осень. С шелестом падали с тополей сухие листья. Кусты шиповника стояли, будто объятые пламенем, и красные ягоды в редкой листве их пылали, как огненные язычки».

Введем этот текст в кавычках в Гугл.



ПРИМЕР


Результат поиска 1–3 из 3 для «За Доном в лесу прижилась тихая, ласковая осень. С шелестом падали с тополей сухие листья. Кусты шиповника стояли, будто объятые пламенем, и красные ягоды в редкой листве их пылали, как огненные язычки». Как выяснилось, это отрывок из «Тихого Дона» (книги четвертой). А забавность примера в том, что у Шолохова этот текст оказался вообще не разбитым на абзацы.

Гугл воспринимает как знаки, связывающие слова в единую фразу, не только кавычки, но и дефис, слэш (косую черту), точку, знак равенства, апостроф.


Результат поиска 1–10 из примерно 124 000 для мать-и-мачеха.
Результат поиска 1–10 из примерно 124 000 для мать-и-мачеха.
Результат поиска 1–10 из примерно 124 000 для мать-и-мачеха.
Результат поиска 1–10 из примерно 124 000 для мать-и-мачеха.
Результат поиска 1–10 из примерно 124 000 для мать-и-мачеха.
Во всех вышеприведенных случаях первым в выдаче стоит текст, фрагмент которого приведен ниже « Мать-и-мачеха (Tussilago farfara)– одно из самых раноцветущих растений зацветает в … Как лекарственное растение мать-и-мачеха применяется, прежде всего…»
При этом все три слова – «мать», «и», «мачеха» – рассматриваются как отдельные, но стоящие рядом и в этой последовательности.
Интересно, что по запросу [мать-и-мачеха]оказалось на 100 документов больше, чем по остальным, но если взять это слово в кавычки, то результат уравнивается.


ПРИМЕР


Запрос [“мать-и-мачеха”]
Результат поиска 1–10 примерно из 27 300 для “мать-и-мачеха”.
Чтобы прояснить этот казус, введем запрос такого вида [мать-и-мачеха – “мать-и-мачеха”].
Результат поиска 1–10 из примерно 35 для “мать-и-мачеха”. В выдаче Санкт-Петербургская Федерация Настольного Футбола Матьимачеха. Королев Петр Трушков Кирилл. 2. Экспромт. Гриневич Василий… Мать-имачеха– игроки получают по 60 рейтинговых очков; Экспромт – игроки… www.kickerclub.spb.ru/tournaments/2005-09-03.html 17k

Количество слов в строке поиска.Во многих источниках встречается информация, что поисковая строка Гугла вмещает 10 слов или что Гугл проводит поиск только по 10 словам.


На момент написания книги Гугл учитывал в запросе 32 слова, а все последующие слова игнорировал. Это хорошо видно, если ввести запрос, содержащий числительные подряд. Например, числа с 1 до 35. В результатах как релевантные отображаются только первые 32 слова запроса [+1 +2 +3 +4 +5 +6 +7 +8 +9 +10 +11 +12 +13 +14 +15 +16 +17 +18 +19 +20 +21 +22 +23 +24 +25 +26 +27 +28 +29 +30 +31 +32 +33 +34 +35].
Результат поиска 1–10 из примерно 381 000 000 для +1 +2 +3 +4 +5 +6 +7 +8 +9 +10 +11 +12 +13 +14 +15 +16 +17 +18 +19 +20 +21 +22 +23 +24 +25 +26 +27 +28 +29 +30 +31 +32 +33 +34 +35. В выдаче Тематический рубрикатор.
Страницы 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21 22 23 24 25 26 27 28 29 30 31 32 33 34 35 36 37 38 39 40 41 42 43 44 45 46 47 48 49 50 51 52… www.amr.ru/topics/index.php?PAGEN_2=8 – 72k -.
В кэше подчеркнуты только 32 слова, и в тексте они также присутствуют.
Стемминг(а также wildcard). Стемминг – возможность усечения слова до его корня. После этого усечения производится поиск релевантных вариантов слов, производных от него. Другими словами, стемминг позволяет искать все однокоренные слова. Техника поиска по маске (wildcard)представляет собой написание базового слова (или его части), после которых идет символ маски – «звездочка» (*), заменяющая собой любое возможное продолжение слова. Таким образом, если поисковая машина поддерживает поиск по маске, то ищутся все слова, которые одинаково начинаются. Эта техника особенно удобна, когда вам неизвестно точное написание конкретного слова либо когда вы хотите включить все возможные варианты слова в свой поиск.
Например, когда по запросу [тарт*]получают как «тарталетку», так и «тартар». Так вот, Гугл эти технологии не поддерживает (как и Яндекс). Зато он поддерживает вариант, когда вместо целого слова вводится звездочка.
Например, по запросу [красная * площадь]будет выдано «Красная, Манежная площади», с подчеркиванием всех этих слов. В какой-то степени это похоже на поиск с расстоянием между словами, применяемый в Яндексе.


Достарыңызбен бөлісу:
1   2   3   4   5   6   7   8   9   10   11




©engime.org 2024
әкімшілігінің қараңыз

    Басты бет