Изучение урологической интернет-аудитории

Сивков А.В., Шадеркин И.А., Шадеркина В.А.

Период появления Интернета приходится на конец 80-х - начало 90-х годов прошлого столетия [1]. За этот короткий период времени Интернет охватил все уголки нашей планеты и стал неотъемлемой частью жизни человечества. К середине 2008 г. число людей, регулярно использующих Интернет, составило около 1,5 млрд. человек (около четверти населения Земли) [1]. На январь 2010 г. общее количество сайтов составило более 200 миллионов [2].

Русскоязычный Интернет начинает свой отсчет развития с 1991 г., когда были зарегистрированны доменные имена первого уровня «.su» (1991 г.) [3], «.ru» (1994 г.) [4] и стали появляться сайты в этих доменных зонах [5]. Со временем прочно закрепилось такое понятие, как «Рунет» - русскоязычный Интернет. Рунет не ограничивается только лишь доменными именами в зоне «.ru», есть очень много русскоязычных сайтов, которые находятся в зонах «.com», «.net», «.org», многие сайты в странах бывшего СССР используют русский язык для представления информации.

Постоянное удешевление персональных компьютеров, доступность интернет-каналов, развитие мобильного «широкополосного» Интернета, широкое распространение компьютеров и каналов связи в учебных учреждениях, наличие в интернете представительства подавляющего большинства государственных и коммерческих учреждений, инициация создания «электронного правительства» - все это делает интернет доступным и нужным для российских граждан и русскоговорящих людей, находящихся за пределами России.

По данным фонда «Общественное мнение», число постоянных пользователей Интернета в России на конец 2009 г. превысило 40 млн человек, что составило 36% взрослого населения страны, а суточная аудитория приблизилась почти к 24 млн человек [6].

По данным портала Яндекс на осень 2009 г., в Рунете насчитывается около 15 млн сайтов. Это 6,5% от всего Интернета. Российские пользователи составляют 2,2% от всех пользователей Интернета [7]. Не удивительно, что в это число попали и люди, которых волнуют проблемы урологического здоровья.

В своем исследовании мы попытались оценить примерную аудиторию людей, которые с использованием интернет-технологий пытаются найти решение проблем, связанных с урологическим здоровьем.

Рисунок 1. Классификатор, построенный на основе кластерного анализа on-line
Рисунок 1. Классификатор, построенный на основе кластерного анализа on-line консультаций на сайте 03.uroweb.ru

МАТЕРИАЛЫ И МЕТОДЫ

В настоящем исследовании мы использовали открытую статистику, которую предоставляют поисковые системы Яндекс (www.yan- dex.ru), Рамблер (www.rambler.ru), Google (www.google.com); данные статистических систем, таких как Live Internet (www.liveinternet.ru), SpyLOG (rating.spylog.ru), Rambler's Top 100 (top100.rambler.ru); статистику урологических порталов www. uro.ru и www.uroweb.ru; результаты 62 438 on-line консультаций, выполненных на сайте 03.uroweb.ru за период с 06.08.2003 г. по 17.01.2010 г.

По данным самой крупной в Рунете статической системы LiveInternet, в оценке которой на январь 2010 г. участвуют 13 537 русскоязычных сайтов с медицинской тематикой, число посетителей (аудитория) этих сайтов за 1 месяц составила 21 322 662 человека. В среднем в день эти сайты посещают 1 399 071 человек. Так как многие посетители в течение месяца посещают эти ресурсы несколько раз, то их общее число нельзя получить простым умножением ежедневного посещения на число дней в месяце.

Согласно подсчетам, ежемесячная российская аудитория медицинских сайтов составляет 15 394 962 человек, а в день эти сайты посещают 1 010 129 наших сограждан. То есть чуть более 4% от общего числа граждан России, ежедневно посещающих интернет, заходят на сайты медицинской тематики. В течение месяца более 10% россиян пытаются найти в Интернете ответы на вопросы, связанные со здоровьем. Из этих данных следует, что значительную роль для людей в решении их проблем со здоровьем сегодня играет Интернет.

ОЦЕНКА УРОЛОГИЧЕСКОЙ АУДИТОРИИ ИНТЕРНЕТА

Мы столкнулись с проблемой оценки урологической аудитории Интернета. В отличие от медицинских сайтов, рейтинга урологических сайтов, который можно легко оценить с помощью таких статистических систем, как LiveInternet, SpyLOG, Rambler's Top100 и пр, не существует. Это связано с рядом факторов.

  • Сайтов, посвященных только урологической аудитории, немного по сравнению с общемедицинскими сайтами.
  • Многие сайты общей медицинской тематики содержат разделы, посвященные вопросам урологии, и участвуют в рейтингах без особого выделения этих разделов в отдельные направления, доступные для анализа.
  • После анализа сайтов выяснилось, что много обсуждений проблем урологического здоровья проходят на сайтах, не позиционирующихся их создателями как медицинские. Это социальные сети: «В Контакте» - vkontakte.ru , «Одноклассники. ru» - odnoklassniki.ru, «Мой Круг» -moikrug.ru (Яндекс), «Мой Мир@Mail.ru» – my.mail.ru (Mail); в блогах (LiveJournal – www.livejournal.com, Блоги@Mail.Ru – blogs.mail.ru, Я.ру – wow.ya.ru, LiveInternet – www.liveinternet.ru, Diary.ru – www.diary.ru, Love Planet – loveplanet.ru/a-journal); на форумах; на сайтах «сексуальной тематики» и пр.
  • Многие сайты не участвуют в рейтингах и не представляют открытую статистику посещений. Поэтому нам пришлось подойти к решению вопроса подсчета урологической аудитории другим путем, используя статистику запросов пользователей Интернета.

Большинство людей, которые пытаются найти ответы на свои вопросы, касающиеся урологического здоровья, прибегают к помощи поисковых систем (порталов). Для поиска нужной информации в Интернете пользователи поисковой системы набирают слова и словосочетания, которые, по их мнению, должны отражать суть искомой информации. Эти слова называются ключевыми словами.

Мы попробовали косвенно оценить аудиторию, интересующуюся проблемами урологического здоровья, по числу запросов по ключевым словам на основных поисковых порталах.

Для этого мы выделили возможные, но нашему мнению, поисковые запросы.

Поисковые запросы были получены нами на основании кластерного анализа 62 438 on-line консультаций, выполненных на сайте 03.uroweb.ru за период с 06.08.2003 г. по 17.01.2010 г. Ключевые слова были выстроены в классификатор в виде иерархического дерева, состоящего из 1365 узлов, включенных в его структуру по принципу множественных связей.

После анализа классификатора выяснилось, что его ветви содержат выражения в том виде, в котором их вводят пользователи, осуществляющие поиск по проблемам урологии в Интернете. В связи с этим мы предположили, что, проведя поиск статистики запросов к поисковым системам, которые соответствуют выражениям этого классификатора, можно найти суммарное число запросов в Интернете, соответствующих поиску по проблемам урологического здоровья.

Количество запросов к поисковым системам называется «статистика запросов». Статистика запросов - информация об обращениях пользователей к поисковой системе по «ключевым словам». В большинстве случаев при работе с сервисом статистики имеется возможность отсеивать результаты по географии или даже по отдельно взятому языку, а иногда и по месяцам.

Основными поисковыми системами в Рунете являются: Yandex, Google, Rambler.

В большинстве случаев поисковые системы предоставляют статистику в несколько упрощенной форме. Например, сервис Яндекса обобщает все словоформы (мн. и ед. число, падежи), опускает предлоги (за, на, под и т. д.) и вопросительные формы (что, когда, как и т. п.). То есть при помощи Яндекса нельзя будет узнать, к примеру, что ищут чаще: ед. число «Дом» или мн. «Дома», а только общее число запросов по всем словоформам. Рамблер в этом плане более точен, и его отчеты по умолчанию выдают сочетания запросов в том виде, в котором их ввел в строку поиска пользователь.

Мы использовали следующие сервисы статистики запросов поисковых систем.

  1. Яндекс: http://wordstat.yandex. ru/?cmd=words
  2. Рамблер: http://adstat. rambler. ru/wrds/
  3. Google: https://adwords.google. com/select/KeywordTo olExternal

Были произведены пробные запросы к поисковым системам, при анализе первичных результатов которых мы установили, что некоторые выражения используются не только в случае урологических интересов, а пересекаются с другими проблемными областями. Например, слово «мазок» может использоваться не только в выражении, означающем забор материала из уретры на исследование, а может быть мазком из цервикального канала, из носа или мазком, используемым в живописи. Поэтому мы исключили эти слова из анализа.

Мы удалили англоязычные выражения (TVT, HIFU и пр.), которые могли использоваться не только русскоговорящей аудиторией, но и англоязычной аудиторией. Это особенно отрицательно сказывалось на релевантности запроса при использовании сервиса статистики поисковой системы Google, т.к. эта система, в отличие от Яндекса и Рамблера, охватывает огромную мировую англоязычную аудиторию.

Также мы исключили слова и фразы с широким смысловым содержимым, которые пользователи набирали очень много раз. Например, слово «секс» набирали в Яндексе за месяц 5 886 550 раз.

После исключения этих выражений из сформированного ранее классификатора их число с 1365 уменьшилось до 1022.

РЕЗУЛЬТАТЫ

При работе с сервисами статистики запросов поисковых систем были получены следующие данные:

  • за месяц в Рамблер было направлено 251 904 запроса с использованием выбранных нами выражений из классификатора;
  • в поисковую систему Google - 1 270 577 запросов.

Эти цифры приблизительно соответствуют соотношению генерируемого трафика между этими поисковыми системами [9].

Сервис статистики запросов поисковой системы Яндекс неудобен для выполнения пакетных запросов, поэтому число урологических запросов к этой системе мы получили согласно данным LiveInternet путем расчета средней посещаемости, взятой из доступной статистики самых известных урологических порталов: uro.ru (средняя посещаемость - 1200 уникальных посетителей в сутки и около 30 000 в месяц, основная аудитория - это профессиональные урологии и врачи смежных специальностей); uroweb.ru (средняя посещаемость - 12 000 уникальных посетителей в сутки и 200 000 в месяц - смешанная аудитория, где превалируют неспециалисты в медицине, которые формируют основную массу посещений). Соответственно, расчетное число запросов к Яндекс составляет 3 194 903 запросов в месяц (таблица 1) [9].

Таблица 1. Запросы к поисковым системам по урологическим проблемам в месяц

Поисковая система % Абсолютные цифры запросов
Яндекс 55,40% 3194903
Google 22,00% 1 270 577
Search.Mail.ru 16,20% 934 249
Rambler 4,40% 251 904
Другие 2,00% 1 1 5 339
Итого 100% 5 766 972

Таблица 2. География общемедицинской и урологической аудитории Интернета (в расчете на 1 мес.)

География аудитории Общемедицинская аудитория Интернета Расчетная урологическая аудитория Интернета
Рунет (все) 100% 21 322 662 1 000 000
Россия 72,20% 15 394 962 722 000
Украина 14,70% 3 134 431 147 000
Беларусь 2,30% 490 421 23 000
Казахстан 2,10% 447 776 21 000

Некоторые пользователи в поиске информации используют одновременно несколько поисковых порталов. Это явление называется пересечением поисковых запросов. Пересечение поисковых запросов представляет собой следующее соотношение: Яндекс, Рамблер и Google - 3,7%, Рамблер и Яндекс - 8,13%, Яндекс и Google 7,51%, Google и Рамблер - 7,31% [10]. Исходя из этих статистических данных, мы вычислили количество уникальных запросов по урологическим тематикам, которые пользователи Интернетом делают за месяц. Эта цифра составила 5 040 095 запросов в месяц.

Следующим шагом мы попытались по запросам определить число уникальных пользователей Интернета, которых интересуют проблемы урологического здоровья. По данным Яндекса один пользователь обращается к поиску в среднем 1-2 раза в день и совершает около 5 запросов [11]. Если ориентироваться на эти данные, то уникальных пользователей, которые в течение месяца интересуются проблемами урологического здоровья, около 1 млн человек.

Нами получены данные, характеризующие аудиторию Интернета, которая интересуется общемедицинскими проблемами и проблемами, связанными с урологическим здоровьем, с дифферен- цировкой по географии пользователей (таблица 2). Распределение этой аудитории по 4 странам, которые составляют основную массу посетителей, взята из открытых источников [8].

ОБСУЖДЕНИЕ РЕЗУЛЬТАТОВ

В доступных источниках нами не найдены работы, которые могли бы помочь в подобных расчетах. Используемый в исследовании подсчет аудитории является достаточно примерным, т.к. при его проведении некоторые данные были получены косвенным путем. Оценить достоверность получен- ных данных, можно, сопоставив суммарную месячную аудиторию двух самых крупных урологических порталов в Рунете uro.ru и uroweb.ru, которая составляет 230 000 пользователей и охватывает примерно 23% от расчетной аудитории Рунета. Поэтому цифра в один миллион пользователей в месяц не кажется сильно завышенной. Оставшиеся 77% от расчетной аудитории вполне могут посещать другие многочисленные сайты Рунета.

Также можно количественно сравнить пользователей Интернета, которых интересуют общемедицинские вопросы (21322662 в месяц), с аудиторией, чьи интересы связаны с проблемами урологии (1 000 000 в месяц), как 21/1. Найденная нами цифра также кажется вполне сопоставимой с известными статистическими данными. По мере формирования более подробного классификатора, который будет включать в себя максимально возможные формы запросов пользователей и появление достоверной открытой статистической информации, можно ожидать более точных цифр расчета урологической аудитории Интернета.

Понятие «урологическая аудитория Интернета» введено нами в исследование, чтобы объединить всех людей, которых каким-либо образом заинтересовали вопросы, касающиеся мочевой системы и половых органов мужчин.

Ранее мы провели анализ обращений на on-line консультации на сайте uroweb.ru. Основная масса вопросов относилась к проблемам мужской сексуальной дисфункции (16,23%), инфекции, передающейся половым путем (15,13%), к инфекции мочевой системы (10,30%), к воспалительным заболеваниям предстательной железы (8,38%), к урологическим заболеваниям детского возраста (7,53%) и к мужскому бесплодию (4,89%). Количество обращений по поводу злокачественных заболеваний мочевой системы составило 2,17% от общего числа. Мы отнесли к разряду неурологических 21,43% вопросов. Это, в первую очередь, те консультации, когда не было выявлено признаков урологических заболеваний. Небольшая часть из этого числа вопросов относилась к смежным специальностям: дерматовенерология, гинекология, неврология, проктология и пр. [12].

Таким образом, люди, интересующиеся проблемами урологии в Интернете, не всегда являются настоящими или возможными урологическими пациентами. Большая часть подобной аудитории - это подростки и молодые мужчины, которые входят в период полового S

созревания, интересуются половой жизнью, анатомией половых органов. Популярность, открытость, доступность и ощущение анонимности предоставляет возможность активного поиска ответов на волнующие их вопросы в Интернете.

В урологическую аудиторию в нашем исследовании попали и сами урологи, которых тоже интересуют урологические вопросы. Но в общей массе пользователей процент специалистов очень низок, поэтому им можно пренебречь в миллионной аудитории.

После того как пользователи ввели ключевые слова, фразы и выражения, поисковые машины выдают результаты поиска в Интернете. В итогах этого поиска оказываются самые разнообразные сайты: специализированные сайты с узкой урологической тематикой; сайты частных и государственных урологических клиник; сайты представителей фарминдустрии и производителей урологических товаров, которые стремятся рекламировать свои продукты; форумы и блоги, где обсуждаются проблемы урологического здоровья; социальные сети с группами по интересам; личные странички врачей-урологов; сайты сексуального характера [13].

Ключевые слова: интернет-аудитория, урологические сайты.

Пользователь попадает по представленным поисковыми машинами ссылкам на эти сайты. Далее он может ограничиться только ознакомлением с информацией, расположенной на этих сайтах, а может и перейти к интерактивному общению: тестированию; обсуждению своей проблемы в группах (социальные сети); ведению блога (интернет-дневника) с возможностью или без комментариев другими участниками сетевого сообщества; получению on-line консультации у врачей-урологов [13].

ВЫВОДЫ

В этом исследовании мы лишь приподняли занавесу крайне интересного социального явления Интернета: значительное число людей (до 1 000 000 уникальных пользователей в месяц) пытаются найти в Интернете ответы на возникающие у них вопросы, связанные с урологическим здоровьем. При этом они довольно часто используют непрофессиональные источники данных, которые могут дать неверную информацию, лишенную доказательной базы, и негативно повлиять на правильный выбор потенциального пациента. Такой выбор может ухудшить раннюю диагностику урологических заболеваний, привести к неправильному или ненужному лечению, отказу от него или к непрофессиональному лечению вне медицинских учреждений.

В связи с этим мы считаем необходимым усиление профессионального присутствия в Интернете, развитие курируемых специалистами урологических интернет-проектов и сайтов с достоверной информацией, ориентированных на урологических пациентов, подростков, молодых мужчин, будущих родителей.

Считаем необходимым дальнейшее изучение интернет-аудитории, интересующейся проблемами урологии. В дальнейшем нам видится необходимым:

  1. изучить механизмы, с помощью которых пользователи Интернетом пытаются решить проблемы, связанные с урологическим здоровьем, оценить примерный перечень и характер этих проблем;
  2. выявить особенности, преимущества и недостатки интернет- технологий, которые применяют пользователи для решения проблем урологического здоровья;
  3. оценить перспективы развития медицинских интернет- технологий и предложить пути использования преимуществ этих технологий в интересах урологических пациентов.

ЛИТЕРАТУРА

  1. Интернет. (б.д.). Получено 17 январь 2010 r., из Википедия: http:// ru.wikipedia.org/wiki/Internet.
  2. January 2010 Web Server Survey. (январь 2010 г.). Получено 17 январь 2010 r., из Netcraft: http://news.netcraft.com/archives/2010/01/07/ january_2010_web_server_survey.html.
  3. .ru. (б.д.). Получено 17 январь 2010 r., из Википедия: http://ru.wikipedia. org/wiki/.ru.
  4. .su. (б.д.). Получено 17 январь 2010 r., из Википедия: http://ru.wikipedia. org/wiki/.su.
  5. Рунет. (б.д.). Получено 17 январь 2010 r., из Википедия: http:// ru.wikipedia.org/wiki/Рунет.
  6. Рунет растет за счет регионов. (12 декабрь 2009 r.). Получено 17 январь 2010 r., из «ВЗГЛЯД.РУ»: http://www.vz.ru/society/2009/12/11/357990. html.
  7. Контент Рунета. (2009). Получено 17 январь 2010 r., из http://download. yandex.ru/company/yandex_on_content_autumn_2009.pdf.
  8. Сайты Рунета / Медицина. (17 январь 2010 r.). Получено 17 январь 2010 r., из LiveInternet.Ru.
  9. Статистика сайта «Сайты Рунета». (17 январь 2010 r.). Получено 17 январь 2010 r., из liveinternet.ru: http://www.liveinternet.ru/stat/ru/ searches.html.
  10. Олег Сахно, Е. С. (10 ноябрь 2007 r.). Сравнение аудитории поисковых систем, посредством анализа поисковых запросов. Получено 18 январь 2010 r., из www.interlabs.ru:http://www.interlabs.ru/articles_1.htm.
  11. Информационные бюллетени Яндекса и другие исследования. (2008). Получено 18 январь 2010 r., из company.yandex.ru: http://company. yandex.ru/facts/researches/.
  12. Шадеркин, И. А. (2008). UKRAINIAN JOURNAL OF TELEMEDICINE AND MEDICAL TELEMATICS. Анализ 20 тысяч отсроченных телемедицинских консультаций (стр. 106). Донецк: НИИ травматологии и ортопедии.
  13. Шадеркин, И. А. (2009). UKRAINIAN JOURNAL OF TELEMEDICINE AND MEDICAL TELEMATICS. Социальные интернет-сети, как место обсуждения проблем урологического здоровья (стр. 104). Донецк: НИИ травматологии и ортопедии.