Извините, регистрация закрыта. Возможно, на событие уже зарегистрировалось слишком много человек, либо истек срок регистрации. Подробности Вы можете узнать у организаторов события.
28-часовой марафон по командному решению бизнес-задач.
Datathon в рамках Data Science Week
Представляем первый дататон в рамках Data Science Week:
28 часов решения реальных бизнес-задач партнеров:
HeadHunter
Прогнозирование зарплаты для вакансий.
Треть вакансий идет без указания зарплаты. Поэтому в поисковую выдачу, если указано требование “зарплата от. до.” такие вакансии не попадают. И таким образом соискатель теряет большую долю вакансий. Возможность прогнозировать зарплату по описанию вакансии позволит показывать пользователям в том числе вакансии, про которые зарплата точно неизвестна, на основе предполагаемой зарплаты.
Мы заинтересованы в постоянном улучшении наших алгоритмов, и сейчас готовы предоставить вам шанс поработать с реальными данными компании HeadHunter, и построить модель прогнозирования зарплаты, проявив оригинальность в feature engeneering, также учитывая бизнес-требования к результату.
HeadHunter
Похожие поисковые запросы.
Бывает, что соискатель и работодатель оперирует разными терминами, имея в виду одну и ту же вакансию, например работодатель назвал вакансию “разработчик java”, а соискатель пытается найти “программист java” и не находит. Есть и множество других случаев, когда вместо исходного запроса, полезно показать похожие запросы, чтобы соискатель и работодатель нашли друг друга.
У вас есть шанс решить задачу поиска похожих запросов, самим придумав, что значит “похожие”, а также применив знания в анализе текстов, коллаборативной фильтрации, content-based рекомендательных системах. Возможно даже, именно вы придумаете новый интересный подход к решению задачи!
Ozon
Рекомендации редких товаров. Хвосты распределения.
Популярные товары легко рекомендовать их купят. Но их покупают и так. А кроме того, прибыль на продаже этих товаров зачастую невелика. Интересно порекомендовать какой-то редко покупаемый товар из так называемого хвоста распределения. Про него мало известно с точки зрения покупок, и поэтому с товарами из хвоста распределения хорошо работать с помощью content-based рекомендаций.
Мы открываем вам часть своих данных о товарах и их покупках, чтобы вы могли попробовать реализовать новые подходы к рекомендациям редких товаров.
Число мест ограничено 6-ю командами, так что мы рекомендуем регистрироваться сразу командой, впрочем, для тех, кто зарегистрируется без команды, будет создана по крайней мере одна команда.
Название команды можно придумать позже, на этапе регистрации команда это контактное лицо (имя и фамилия) и минимум еще 5 других участников.
Если вы контактное лицо команды, указывайте себя же, в качестве контактного лица. Если вы в команде, укажите имя и фамилию контактного лица вашей команды в поле контактное лицо команды
Если у вас нет команды оставьте поле контактное лицо команды пустым.
Мы не сомневаемся, что участники мероприятия, с которыми компании-партнеры дататона делятся своими данными, имеют навыки и ресурсы для решения поставленной задачи.
Тем не менее вы получите доступ на Spark-кластер, с подключенным к нему ipython notebook-ом
3data
Предоставляемые ресурсы
С 1 сентября персональные данные нужно будет хранить в России, и обрабатывать их в облаках за рубежом становится невыгодно. В рамках дататона мы развернули для вас инфраструктуру на российских серверах, чтобы вы могли решить бизнес-задачи, обрабатывая данные на мощном Spark-кластере, с подключенным к нему IPython Notebook-ом.
В заключении
Если вам интересен анализ данных на практике, если вам хочется решать бизнес-задачи с помощью современных технологий анализа данных и вы умеете пользоваться Apache Spark+IPython Notebook, либо у вас есть доступ к другим технологиям обработки и анализа данных, и вы готовы к командной работе в течение 28 часов 29 августа и 30 августа, регистрируйтесь на Datathon проходящий в центре Digital October в Москве в рамках Data Science Week.