"Яндекс" объявил об учреждении научных стипендий для индивидуальных исследователей и коллективов, которые специализируются в области автоматической обработки веб-данных.
Принять участие в конкурсе проектов приглашаются исследователи, а также студенты и аспиранты, независимо от возраста или стажа работы в области информационных технологий. Научная стипендия назначается на срок от 2 до 6 месяцев в объеме от 30 до 100 тыс. российских рублей индивидуальным исследователям и от 100 до 300 тыс. рублей - исследовательским группам. Всего на стипендии выделено 3 млн. российских рублей.
На конкурс могут быть представлены проекты по следующим темам:
- Автоматическая обработка текста, лингвистика. Статистические и семантические методы текстового поиска применительно к вебу. Морфологические, синтаксические анализаторы. Снятие лексической, семантической неоднозначности. Нахождение и использование кросс-языковых ресурсов.
- Анализ поисковых запросов, сеансов и протоколов. Построение и использование тезаурусов по пользовательским сеансам. Тематическая классификация запросов. Моделирование информационной потребности и поведения пользователя. Влияние сеанса и профиля пользователя на ранжирование. Статистическая и синтаксическая сегментация запроса, переформулирование запроса.
- Мультимедийный поиск. Поиск изображений и музыки по содержанию. Кластеризация и классификация изображений.
- Оценка качества поиска. Автоматические системы оценки качества поиска. Анализ поведения пользователей для оценки качества.
- Производительность и распределенные системы. Эффективное исполнение запроса в распределенных системах: переформулирование запроса и выбор текстовых баз. Оптимизация, учитывающая ранжирование; частичные ответы.
- Анализ ссылок в вебе. Меры популярности страниц, построенные на основе анализа ссылок. Обнаружение и анализ сообществ, их тематики, учет знания о сообществах в поиске. Обратная связь со стороны поисковых систем. Динамика появления и исчезновения ссылок, характеристики и модели веб-графа.
- Структура веб-сайтов и веб-страниц; полудубликаты. Сегментация веб-страниц, выделение записей баз данных и данных, содержащихся в страницах, сгенерированных по шаблонам. Выявление структуры и функциональности веб-сайтов. Алгоритмы выявления дублей документов и "зеркал" сайтов; построение и использование сигнатур, устойчивых к небольшим изменениям документов.
- Автоматическая классификация веб-страниц и веб-сайтов. Веб-каталог как учитель: классификация по зашумленным или неполным обучающим выборкам. Классификация с использованием гиперссылок. Построение и модификация тематических рубрикаторов на основе веб-корпуса.
- Анализ стиля. Построение жанрового рубрикатора веба; прослеживание эволюции традиционных и выявление новых функциональных стилей в вебе. Жанровая классификация веб-текстов. Выявление положительных и отрицательных оценок в текстах. Выявление ангажированных и рекламных текстов.
- Автоматическая обработка новостей. Разбиение потока новостных сообщений на событийные сюжеты. Построение иерархической структуры событийных сюжетов. Представление событийного сюжета: аннотирование, исправление фактических и стилистических ошибок в аннотациях. Устранение избыточности и дублирования в новостных сюжетах. Технология извлечения фактов для анализа новостей. Персонализация новостного потока. Рапространение информации в лентах СМИ и дневниках.
- Автоматическое аннотирование, ответы на вопросы. Составление аннотации для набора документов: аннотирование результата поиска, новостного сюжета, построение summary для сайта и т.п. Аннотирование документов в зависимости от контекста: поискового запроса, жанра документа, пользовательского профиля и т.п. Представление результата поиска: структурирование, аннотирование, ответы на вопросы. Учет текстов ссылок при аннотировании документов, сайтов и результатов поиска.
- Рекомендующие системы и совместная фильтрация. Анализ поведения пользователей интернет-магазинов, переходов пользователей. Совместный анализ предпочтений пользователей.
Для проведения исследований в рамках программы научных стипендий "Яндекс" готов предоставить исходные данные (поисковый индекс, протоколы запросов и т.д.), а также вычислительные мощности своего серверного кластера.
Прием заявок на конкурс будет осуществляться до 31 октября 2004 г. На стипендию могут претендовать только граждане России, так что белорусским разработчикам для получения гранта необходимо оформить партнерство с российскими коллегами. Результаты конкурса и список стипендиатов будут объявлены в ноябре.
Все подробности о программе "Яндекса" можно узнать на странице company.yandex.ru/grant.
Анатолий АЛИЗАР
Горячие темы