Сышышь ты, выходи сюда,
поговорим !

Сентимент и Google; больше чем чувство

  1. В чем проблема?
  2. Гайки и болты
  3. Подход
  4. Почему это имеет значение?

На прошлой неделе мы рассмотрели, как Google может выглядеть и использовать социальный граф в поиске и рекламе , Люди действительно являются постоянно растущим источником сигналов, которые можно добывать. Это довольно очевидно. Конечно, это может быть связано с обзорами, а точнее, сентиментами.

Как может поисковая система справиться с этим, хотя? На самом деле, с годами им приходилось сталкиваться с трудностями, но они продолжают пытаться. В последний раз я действительно затронул эту тему в 2011 году; Как Google обрабатывает отзывы и настроения?

На этой неделе, однако, была получена интересная патентная награда (для Google), которая снова коснулась этой области, так что это то, что мы собираемся получить сегодня. Патент в вопросе является;

Специфичная для домена классификация настроений ; Подано 17 июня 2011 г. - Награжден; 15 января 2013

В чем проблема?

Для начала давайте рассмотрим самый тревожный аспект; терминология пересекается. Это было хорошо объяснено с

«(…) Оно не учитывает настроения, выраженные специфичными для предметной области словами. Например, слово «маленький» обычно указывает на позитивные настроения при описании портативного электронного устройства, но может указывать на негативные настроения при описании размера порции, которую обслуживает ресторан. Таким образом, слова, которые являются положительными в одной области, могут быть отрицательными в другой. Кроме того, слова, которые имеют отношение к одному домену, могут не относиться к другому домену. Например, «время автономной работы» может быть ключевым понятием в области портативных музыкальных проигрывателей, но не относящимся к сфере ресторанов. Это отсутствие эквивалентности в разных областях затрудняет выполнение классификации настроений в нескольких областях. «

Это действительно выдвигает на первый план одну из основных проблем. Что такое позитивное настроение в одном случае, может не быть в другом. Чтобы справиться с этим, они приступили к назначению предметно-ориентированной лексики настроения, которую можно использовать в документах определенного характера.

Конечно, еще одна важная проблема - проверка рецензентов. Но я покрыл это последний раз так что мы останемся на этой трассе на сегодня.

Теперь, прежде чем вы заберетесь слишком далеко, они описывают «домен» как особую сферу деятельности, заботы или функции (например, рестораны, электронные устройства, международный бизнес и фильмы). Это не относится конкретно к доменным именам в Интернете .

Гайки и болты

Они определяют отслеживание настроения для различных объектов, в том числе;

  • компании,
  • товары,
  • и люди.

И чувство как бытие;

  • положительны,
  • отрицательна,
  • или нейтральный (то есть чувство не может быть определено).

И документы, подтверждающие настроение как;

  • веб-страницы и / или части веб-страниц
  • текст книг
  • газеты
  • журналы
  • электронная почта
  • рассылка новостей
  • и / или другие электронные сообщения

Что само по себе является интересной коллекцией. Часть «электронных писем» будет особенно интересна для толпы оловянной фольги. Лично я просто думаю, что они закрывают свои задники списком. Важно было, по крайней мере, выделить настолько далеко, чтобы пробиться сквозь простые веб-страницы.

« Например, документы в доменном корпусе могут включать документы, относящиеся к ресторанам, такие как части веб-страниц, полученные с веб-сайтов, специализирующихся на обсуждении ресторанов. Аналогичным образом, доменные документы в корпусе могут включать веб-страницы, полученные с веб-сайтов, которые включают обзоры и / или обсуждения, связанные с портативными электронными устройствами, такими как мобильные телефоны и музыкальные проигрыватели. Напротив, документы в независимом от домена корпусе могут включать документы, связанные с множеством различных доменов, так что ни один домен не будет преобладать. Кроме того, документы в независимом от домена корпусе могут быть получены из источников, не связанных с каким-либо конкретным источником, таких как журналы общего интереса или другие периодические издания. »

Таким образом, настроение не всегда будет касаться простого обзора сайтов. Конечно, они считаются, но не единственное место, чтобы посмотреть. И, конечно же, мы можем вернуться к статье на прошлой неделе и рассмотреть как социальный граф может сыграть в это тоже.

Подход

Они смотрели на создание предметно-ориентированного классификатора (опять же, домен - это не веб-сайт, а концептуальное пространство). По сути, были бы сентиментальные условия, скажем, веб-сайт о «поисковой оптимизации». Домен не означает «Searchmetrics.com». Я следую?

Таким образом, такой веб-сайт, как наш, может иметь более одной классификации доменов. Это имеет очевидный смысл для документов, которые охватывают несколько тем (вспомним хаб-страницу веб-сайта газеты). Конечно, это будет огромный элемент обработки, поэтому, как и многие другие вопросы, связанные с поиском информации, они обсуждают использование учебных документов в процессе.

Где можно найти лексиконы? Трудно сказать, но в патенте они упоминают;

« В одном варианте осуществления независимая от домена лексика настроений основана на лексической базе данных, такой как электронная лексическая база данных WordNet, доступная в Принстонском университете Принстона, штат Нью-Джерси. Лексическая база данных описывает сопоставления между связанными словами. То есть база данных описывает синоним, антоним и другие типы отношений между словами ».

А потом…

«(…) Администратор выбирает начальные термины для независимой от домена лексики настроений, просматривая лексическую базу данных и вручную выбирая и оценивая слова, выражающие высокие настроения. Администратор первоначально выбирает около 360 таких слов в одном варианте осуществления, хотя количество слов может варьироваться в других вариантах осуществления. Этот начальный набор слов расширяется посредством автоматизированного процесса и включает синонимы и антонимы, на которые есть ссылки в лексической базе данных. Расширенный набор слов составляет независимую от предмета лексику чувств. »

Что интересно тем, что оно частично ручное, а частично автоматизированное. Интересно, будут ли рецензенты Google вступать в действие с такими вещами?

Они даже привели несколько примеров использования сайтов в элементе обучения, таких как;

  • популярные обзоры продуктов
  • Амазонка
  • CitySearch
  • CNET

Опять же, только примеры ... это было сделано еще в 2011 году.

«На этих сайтах есть текстовые обзоры продуктов, которые авторы рецензий отмечают вручную с помощью соответствующих числовых или буквенных оценок (например, 4 из 5 звездочек или оценка« B- »). »

Google процесс анализа настроений

Почему это имеет значение?

Опять же, я бы начал оглядываться на наш последний пост в социальной сети. Конечно, этот метод оценки был бы важен, чтобы помнить о таких областях, как электронная коммерция, местное и создание бренда / авторитета, но если им удастся привести его в соответствие с другими алгоритмическими элементами, такими как социальный график, он может сыграть большую роль в вашем поиске видимости в персональном масштабе.

Поскольку так много поисковых маркетологов настороженно относятся к тем, кто в последнее время ссылается на них, вы также можете узнать, кто о вас говорит и в каком контексте. Рискну сказать, что это дает немного больший вес в мониторинг слежения , чем просто поиск целей для вашей следующей кампании по созданию ссылок.

И, конечно, все это, надеюсь, должно начать тянуть вас назад из бездны близорукости графа ссылок. В Google происходит гораздо больше, чем просто ссылки. Охватите социальные графы, ассоциации сущностей, настроения, графы знаний и их вид. Тогда, возможно, (ваш) SEO не умрет, он будет развиваться.

Больше чтения;

В чем проблема?
Как может поисковая система справиться с этим, хотя?
Я следую?
Где можно найти лексиконы?
Интересно, будут ли рецензенты Google вступать в действие с такими вещами?